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Differenziale, Funzioni, Infinitesimale, 
Locale/globale, Sistemi di riferimento, Stabilità/instabilità, 
Variazione 


L’opposizione +locale/globale + è una di quelle opposizioni fondamentali che, 
come quelle tra il discreto e il continuo o tra il finito e l’infinito, sono proteiformi 
e intervengono a tutti i livelli della riflessione e della pratica matematica. È una 
opposizione portante, organizzatrice e distributrice il cui contenuto è sia concet- 
tuale sia tecnico. Si può dire che è un’opposizione dotata di un eminente valore 
categoriale. 

Questa opposizione fa parte della lingua naturale ed è spontaneamente uti- 
lizzata per indicare situazioni certamente diverse ma la cui intuizione è relativa- 
mente unitaria. Se ne darà qualche esempio scelto a caso fra i molti. 

Si è iniziato l’articolo « Locale/globale » di questa Enciclopedia con alcune ri- 
flessioni informali sulla struttura semantica di un lessico. Si tratta di un esempio 
tipico. In questo caso si utilizza il termine ‘locale’ per parlare di campi semantici 
ristretti e ben articolati come il campo semantico dei colori, o degli utensili di 
cucina, o di sottodiscipline di una certa scienza, ecc. In particolare, gli articoli di 
questa Enciclopedia sono, relativamente al tutto che essa costituisce, delle orga- 
nizzazioni locali. Si vede che l’accezione del termine ‘locale’ ricopre qui due pro- 
blemi. In primo luogo quello delle classificazioni, dato che ogni campo semanti- 
co consiste nella classificazione secondo una regola di una certa varietà. E inoltre 
quello del livello di osservazione scelto per operare la classificazione. Per precisa- 
re un poco questa accezione tassonomica, si consideri l’esempio del sistema fono- 
logico di una lingua. Questo sistema può essere considerato in un primo mo- 
mento come l’insieme degli «atomi» fonetici. Questo insieme, che si suppone ben 
definito su basi fisico-audioacustiche, svolge il ruolo di una totalità di elementi 
considerati analoghi, omogenei rispetto alla loro natura, anche se non equivalenti 
l’uno all’altro. Si tratta in qualche modo di un quadro globale di riferimento. Si 
potrebbe allora credere che, detto 9 questo insieme, se p è un «atomo» fonetico, 
vale a dire un suono fonetico elementare come una consenante o una vocale, l’ap- 
proccio formale della tassonomia associata a P si riduca allo studio della relazio- 
ne di appartenenza insiemistica pe P. Ma non è affatto vero. Un tale approccio 
sarebbe di una povertà estrema. Infatti i suoni fonetici elementari sono forme 
audioacustiche che possono variare in modo continuo e che sono dunque defor- 
mabili. Ciò significa che lo spazio 9 è naturalmente munito di una topologia (cfr. 
l’articolo « Geometria e topologia») che definisce una relazione di vicinanza tra 
i suoni fonetici elementari. E per di più la percezione non è sensibile a tutte le 
proprietà di questi suoni fonetici elementari. Come hanno mostrato numerose 
esperienze effettuate in questi ultimi quindici anni, la percezione fonetica è ca- 
tegoriale. Ciò significa quanto segue. Si consideri una sequenza di N stimoli 
(una dozzina) (s,, ..., sy) che conduca in modo progressivo per esempio dalla sil- 


Sistematica locale 342 


laba [pa] alla sillaba [ba] in una lingua in cui la differenza sordo/sonoro []/[3] 
sia pertinente. Si sottopongano allora dei soggetti a test di identificazione e di 
discriminazione. I primi test consistono nel domandare ai soggetti, ai quali si 
presenta una serie aleatoria di occorrenze degli s;, di riconoscere ogni occorrenza 
come [pa] 0 [ba]. I secondi test consistono nel domandare ai soggetti, ai quali si 
presenta una serie aleatoria di coppie (s;, s11) di stimoli successivi, se distinguo- 
no i due stimoli proposti. Mediante una statistica delle risposte, i test di identi- 
ficazione conducono a risultati scontati a priori. Si ottiene una risposta di 100 per 
cento di [pa] e di o per cento di [ba] per i primi stimoli s,...sy, una risposta di 
100 per cento di [ba] e di o per cento di [pa] per gli ultimi stimoli s,...sy, e la 
percentuale delle risposte [pa] crolla catastroficamente per essere rimpiazzata 
dalla risposta [ba] nella zona intermedia. Si ottiene cosî un'interfaccia (una fron- 
tiera) K che separa la categoria [pa] dalla categoria [ba]. In compenso i risultati 
dei test di discriminazione conducono a risultati che hanno molto sorpreso i fone- 
tisti. Se si considera una percezione continua (non categoriale) come quella dei 
colori, è un fatto chiaro e appartenente all’esperienza usuale come si possano al- 
trettanto bene distinguere due sfumature di rosso o di arancione vicine quanto 
una tinta rosso-arancione da una tinta arancione-rosso. La scomposizione del 
campo dei colori in categorie etichettate da nomi è di natura linguistica e pratica- 
mente non influisce affatto sulle capacità percettive di discriminazione. Ma non 
succede la stessa cosa nel caso della percezione fonetica. I test di discriminazione 
mostrano che non esiste discriminazione intracategoriale. Si possono discriminare 
soltanto stimoli vicini separati da K, vale a dire riconosciuti come differenti. È in 
questo senso che la percezione è categoriale. Essa è subordinata all’identifica- 
zione. Come dicono i fonetisti, si effettua su basi assolute. La percezione catego- 
riale è un fenomeno percettivo di primaria importanza. Essa spiega come un 
flusso acustico continuo può essere percettivamente discretizzato e diventare per 
ciò stesso il supporto di un codice. Si vede che la percezione fonetica manifesta 
essenzialmente la categorizzazione dello spazio topologico 9 dei suoni fonetici 
elementari con un sistema K di discontinuità (cfr. l’articolo « Continuo/discreto ») 
che vi definiscono una sorta di «geografia» (domini separati da frontiere). I do- 
mini di 9 delimitati da K sono i fonemi del sistema. Questi fonemi sono classi 
di equivalenza di suoni fonetici elementari chiamati anche allofoni. 

Si capisce molto bene con questo esempio l’importanza dei concetti struttu- 
ralisti introdotti da Saussure e sviluppati da Jakobson e Hjelmslev (cfr. l’articolo 
«Struttura »). Come classe di equivalenza di allofoni, un fonema non può avere 
una definizione puramente audioacustica. Esso è definito dal suo valore, vale a 
dire dall’estensione del suo dominio in 9. Ora, dato che questa estensione è de- 
terminata dal sistema globale di interfaccia K, un fonema non ha un'esistenza 
isolata. Esso non esiste se non in modo relazionale per mezzo delle sue relazioni 
con gli altri elementi del sistema. Se si associa ad ogni dominio una «capitale », 
cioè un allofono prototipico che occupa approssimativamente il baricentro del do- 
minio stesso, si può dire che i prototipi costituiscono gli elementi del sistema, cioè 
il suo aspetto locale, ma che, quanto al valore, il sistema globale è implicitamente 
presente in ciascuno degli elementi. 
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Ci si trova in questo caso in presenza di una esemplificazione del paradigma 
strutturalista. L’approccio strutturalista consiste essenzialmente nell’interpreta- 
re le tassonomie in termini di categorizzazione come sistemi di rapporto, vale a 
dire in termini di sistemi di discontinuità che scompongono in domini (in classi 
di equivalenza) un certo spazio topologico. Ciò è valido in particolare per i campi 
semantici. In quest'ottica il locale si riferisce agli elementi del sistema e il globale 
al sistema stesso. E il postulato strutturalista del primato del criterio relazionale 
dell’identità sul criterio sostanziale (del primato della differenza sull’identità, cfr. 
l’articolo «Identità/differenza») ribadisce che, quanto al valore, è il globale che 
determina il locale. Questo punto di vista si oppone risolutamente al punto di vi- 
sta riduzionista e «atomista» secondo cui gli elementi del sistema hanno un’esi- 
stenza autonoma e si aggregano per interazione in un sistema globale a partire 
dalle loro proprietà intrinseche. 

Per ritornare alla struttura dei lessici e delle enciclopedie, si vede che il pro- 
blema è quello dell’estensione, del prolungamento, dei campi semantici e quello 
dei loro incollamenti. Il campo semantico che, in ciò che precede, funzionava co- 
me un quadro di riferimento globale inducente una categorizzazione, funziona 
ora come un campo locale suscettibile di estendersi e di intersecarsi con altri 
campi locali. Si entra in questo caso in una problematica completamente diversa 
in cui si tratta di aggregare dei domini locali. Ognuno di noi ha sperimentato co- 
me le carte geografiche possono essere incollate in modo da formare una carta 
globale. Questa esperienza elementare rende manifesta l’eminente relatività del- 
la dialettica del locale e del globale. Essa rende anche manifesta l’importanza del 
livello di osservazione scelto. Semplificando i dati, per esempio usando l’astra- 
zione nel caso semantico, è possibile ridurre un sistema globale a una situazio- 
ne locale. 

Nel suo sviluppo, la matematica ha incontrato problemi analoghi, ma dato 
che gli oggetti matematici sono oggetti costruiti, ha potuto dare un contenuto 
tecnico e operatoriale ai diversi aspetti della dialettica del locale e del globale. Essa 
ha potuto, in numerosi casi, rispondere in modo specifico, esplicito e profondo 
a problemi come i seguenti: in quale misura delle condizioni locali impongono 
proprietà o comportamenti globali? In quale misura la struttura globale impone 
reciprocamente delle condizioni locali? In quale misura c’è equivalenza tra de- 
terminazione locale e determinazione globale? Quali sono i metodi di passaggio 
dal locale al globale? Come si può localizzare una situazione? ecc. 

Questi diversi problemi sono di una complessità cosi proliferante che non è 
possibile, in un articolo di sintesi come questo, neppure enumerarne semplice- 
mente i diversi aspetti. Ci si limiterà dunque, in modo estremamente rudimen- 
tale e, purtroppo, tecnicamente molto vago, a ripercorrere alcuni problemi svi- 
luppati in modo più preciso negli articoli +Differenziale +, +Funzioni+, +Infini- 
tesimale +, +Locale/globale +, + Sistemi di riferimento +, +Stabilità/instabilità + e 
+Variazione +. 
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1. La geometria dello spazio fisico. 


Ogni nostra esperienza pratica conferma che lo spazio fisico è localmente eu- 
clideo. Il primo esempio storico di passaggio dal locale al globale è fornito dal- 
l’estrapolazione di Euclide che postula che, globalmente, lo spazio è ancora eu- 
clideo. Questa estrapolazione si esprime assiomaticamente con il famoso assioma 
delle parallele che è un giudizio sintetico a priori caratteristico della geometria e 
che la rende irriducibile alla logica. Con la comparsa delle geometrie non eucli- 
dee (iperboliche ed ellittiche), si è preso coscienza del fatto che esistono molti 
spazi globali che 1) sono omogenei, cioè possiedono ovunque la stessa struttura, 
e 2) sono localmente euclidei. Questi spazi omogenei sono caratterizzati dalla 
loro curvatura (positiva per gli spazi ellittici e negativa per gli spazi iperbolici) e 
la loro omogeneità è descritta con il gruppo di invarianza. Di qui l’idea fonda- 
mentale, dovuta a Felix Klein, di caratterizzare una geometria con il suo gruppo 
di invarianza e con le proprietà invarianti sotto l’azione di questo gruppo (cfr. 
gli articoli «Geometria e topologia», «Invariante »). 

Se si abbandona la condizione di omogeneità, si arriva a una situazione pit 
generale che Riemann è stato il primo a immaginare chiaramente. Si tratta di 
spazi la cui metrica varia, vale a dire la cui struttura euclidea tangente cambia 
con il punto considerato. Ciò implica che non c’è più gruppo di invarianza nel 
senso precedente, in altre parole che gli «osservatori » locali non possono pit « co- 
municare ». Per ristabilire la «comunicazione », occorre fare la sintesi del punto 
di vista di Klein e del punto di vista di Riemann. Questa sintesi è essenzialmente 
dovuta a Cartan. Essa è fondamentale per la relatività generale. 


2. I livelli di struttura e la dialettica locale/globale. 


Ciò che caratterizza la geometria moderna è l’estrema estensione del concetto 
di spazio e la ricchezza delle procedure di costruzione di spazi. Questa diversi- 
ficazione proliferante del «genere» spazio in «spazi» pone dei problemi di classi- 
ficazione che sono stati e sono tuttora uno dei fattori determinanti del progresso 
concettuale della geometria. 

Si citerà ora una procedura di costruzione che è fondamentale pur essendo 
elementare. Essa consiste nel partire da pezzi di spazi standard (in generale gli 
spazi R”) e nell’incollarli. Se U e V sono due pezzi, l’incollamento consisterà nel- 
l’identificare un sottopezzo U' di U con un sottopezzo V' di V. Questa identifi- 
cazione significa che si considera un isomorfismo tra U' e V'. Ma la nozione di 
isomorfismo è una nozione fondamentalmente relativa. Essa dipende dal livello 
di struttura considerato. Ora gli spazi standard R” sono naturalmente muniti di 
strutture sempre più «rigide», sempre pit vincolanti, che costituiscono una ge- 
rarchia di livelli, ciascun livello essendo associato a (e anche caratterizzato da) un 
tipo di applicazione, di morfismo, tra spazi. Il livello di base è il livello insiemi- 
stico che è il meno vincolante. I morfismi associati sono le applicazioni e gli iso- 
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morfismi, le applicazioni biiettive (cfr. gli articoli «Insieme» e « Applicazioni »). 
Il primo livello che manifesta una certa coesione è il livello topologico. I morfi- 
smi associati sono le applicazioni continue e gli isomorfismi, detti anche omeo- 
morfismi, le applicazioni biiettive bicontinue (cfr. l'articolo « Geometria e topo- 
logia»). Se si incollano pezzi di R” mediante gli omeomorfismi si ottengono spazi 
detti «varietà topologiche». Un livello più vincolante di quello topologico è il 
livello differenziabile. Dato che R” è uno spazio vettoriale normato, se f: U> V è 
un'applicazione continua tra due aperti di R*, si può dire quando è differenzia- 
bile (cfr. l’articolo « Differenziale »). I morfismi associati a questo livello di strut- 
tura sono dunque le applicazioni differenziabili e gli isomorfismi, detti anche dif- 
feomorfismi, sono le biiezioni bicontinue differenziabili insieme alle loro inverse. 
Se si incollano pezzi di R” con diffeomorfismi si ottengono spazi detti «varietà 
differenziabili », i quali costituiscono il principale esempio di spazi ottenuti con 
un processo di incollamento. 

Per costruzione, le varietà differenziabili sono localmente triviali (cfr. l’arti- 
colo +Locale/globale+) poiché sono localmente diffeomorfe a spazi standard R”. 
Esse si distinguono dunque soltanto globalmente. Se si vuol tentare di classi- 
ficarle a meno di diffeomorfismi, occorre di conseguenza costruire degli inva- 
rianti differenziabili (cioè invarianti per diffeomorfismo) e cercare di trovare una 
lista abbastanza ricca di invarianti affinché i loro valori, data una varietà M. , sia- 
no sufficienti a caratterizzare M. Un tale programma si scontra con terribili dif- 
ficoltà che sono ancora lungi dall’essere risolte. Ma alcune idee si impongono in 
modo naturale. La prima idea è quella di determinare quali vincoli impone un 
livello di struttura inferiore a un livello di struttura superiore. Il livello insiemi- 
stico non impone quasi nessun vincolo. Infatti l’unico invariante insiemistico ri- 
spetto alle biiezioni è il numero cardinale, e tutte le varietà «normali» hanno la 
potenza del continuo. In compenso il livello topologico è di grande importanza. 
Se M e N sono due varietà differenziabili diffeomorfe, sono a fortiori omeomorfe 
in quanto varietà topologiche. Si può dunque cominciare tentando di classificare 
le varietà topologiche per poi classificare, essendo dato un tipo topologico, le 
strutture differenziabili che sono compatibili con esso (supponendo che ne esista- 
no, il che esige che il tipo topologico considerato non sia troppo « patologico »). 

Lo strumento principale per classificare le varietà topologiche è la topologia 
algebrica (detta inizialmente topologia combinatoria) inventata da Poincaré. Essa 
comprende due rami principali, la teoria dell’omotopia e la teoria dell’omologia- 
coomologia. La teoria dell’omotopia parte da una semplice osservazione. Ciò che 
distingue tra loro le forme globali delle varietà è in particolare il modo in cui 
sono «bucate» o comprendono dei «vuoti». Il miglior modo per misurare queste 
caratteristiche topologiche globali di una varietà topologica M (e più in generale 
di uno spazio topologico) è quello di «immergere » mediante applicazioni conti- 
nue f : 5" M delle sfere di dimensione x in M e di cercare di contrarle in un pun- 
to. Se la «sfera» f(.5) comprende un «buco», allora questo buco farà ostruzione 
alla contrazione. Se per esempio, partendo da un punto base x, di una sfera .S2, 
un «osservatore » dipanando un filo descrive un cammino qualunque che ritorna 
in x, (un tale cammino chiuso si chiama laccio ed è un’applicazione continua 
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f:S1 5°) egli potrà riportare tutto il filo in x) facendolo scivolare sulla superfi- 
cie di 5°. Una tale deformazione di un laccio si chiama «omotopia». Se in com- 
penso, camminando su un toro, l’osservatore descrive un laccio facendo il giro 
di un meridiano o di un parallelo, non potrà più contrarre il laccio corrispon- 
dente in un punto. La sfera è uno spazio senza omotopia in dimensione 1 men- 
tre il toro è uno spazio che possiede omotopia in dimensione 1 e ciò per ragioni 
globali. Similmente, se l’osservatore camminando su un piano al quale è stato 
tolto un punto 4 descrive un laccio che circonda questo punto, non potrà con- 
trarlo, poiché l'assenza del punto a fa ostruzione. Anche un piano senza un pun- 
to è dunque uno spazio che possiede omotopia in dimensione 1 ma questa volta 
per ragioni locali. D'altra parte se l’osservatore descrive un laccio nello spazio a 
tre dimensioni R? senza il punto a, potrà sempre contrarlo perché dispone di una 
dimensione supplementare che gli permette di scansare a. R*— (a) è dunque uno 
spazio senza omotopia in dimensione 1. Ma è intuitivo che una sfera 5° che com- 
prende a in R* non potrà essere contratta in un punto, poiché l’assenza di a le fa 
ostruzione. R*—(a) è dunque uno spazio che possiede omotopia in dimensione 
2. La scoperta principale di Poincaré è che, dato uno spazio M, se si considerano 
i lacci a meno di omotopia (cioè se si considerano come equivalenti due lacci de- 
formabili con continuità l’uno nell'altro) e se si compongono due lacci concate- 
nandoli (percorrendoli uno di seguito all’altro), si ottiene sull’insieme delle classi 
di omotopia dei lacci una struttura algebrica di gruppo. Questo gruppo, detto 
gruppo fondamentale o gruppo di Poincaré di MM e indicato con x (M), è il pri- 
mo esempio di invariante algebrico utile alla classificazione delle varietà. Di fatto 
il gruppo fondamentale di uno spazio topologico M non è soltanto un invariante 
topologico, ma un invariante del tipo di omotopia. Esso varia funtorialmente con 
M (si veda l’articolo « Trasformazioni naturali / categorie»). Si definiscono nello 
stesso modo i gruppi di omotopia t1z(MM) in dimensione superiore. 

Si vede come un invariante algebrico come il gruppo fondamentale inter- 
viene nel problema della classificazione. Dato che x; è un funtore della catego- 
ria degli spazi topologici puntati nella categoria dei gruppi, ogni omoemorfismo 
h: MN tra due spazi topologici induce un isomorfismo h* : t,(M)+n,(N)trai 
loro gruppi fondamentali. Se dunque 7t;(M) e x (I) non sono isomorfi, M e N 
non possono essere omeomorfi. Per esempio, dato che la sfera S? non possiede 
omotopia in dimensione 1 mentre il toro 7 la possiede, 5? e 7 non possono esse- 
re omeomorfi. Reciprocamente si cercherà di classificare gli spazi topologici che 
hanno gli stessi gruppi di omotopia. 

Quanto all’omologia, è inizialmente una tecnica combinatoria adattata agli 
spazi muniti di una triangolazione (cfr. l'articolo « Geometria e topologia»). Essa 
consiste nello studiare i cicli di uno spazio (cioè le catene di bordo nullo) modulo 
i bordi (cioè i cicli che sono bordi di catene). L’omologia è strettamente legata 
all’omotopia. Considerando le forme lineari sulle catene, si definiscono dual- 
mente i gruppi di coomologia. 

L'interesse principale dei gruppi di omotopia, di omologia e di coomologia 
è di essere oggetti a/gebrici che misurano la struttura globale degli spazi e che va- 
riano funtorialmente. Si può svilupparne un calcolo (che costituisce l’oggetto del- 
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la topologia algebrica) studiando il loro comportamento in rapporto alle proce- 
dure standard di costruzione e di decomposizione degli spazi (sottospazi, spazi 
quoziente, spazi prodotto, fibrazioni, ecc.). A partire dal momento in cui si di- 
spone di tali strumenti per trattare il livello topologico si cercherà di sapere in 
quale misura questo livello vincola i livelli gerarchicamente superiori e in parti- 
colare il livello differenziabile. Data una varietà topologica M, si cercherà di clas- 
sificare le strutture differenziabili su /M che inducono la sua struttura topologica. 
L’idea principale è quella di tradurre queste strutture con classi di omotopia di 
applicazioni tra spazi associati a M e di applicare i metodi della topologia alge- 
brica.. i 

Oltre questi metodi di topologia algebrica si è stati condotti ad inventare me- 
todi corrispondenti direttamente al livello differenziabile e che sono l’oggetto 
della topologia differenziale. Tra questi occorre citare prima di tutto la teoria di 
Morse e il cobordismo. Poiché la classificazione delle varietà a meno di omeo- 
morfismi è troppo complicata, s’indebolisce la nozione di omeomorfismo consi- 
derando due varietà M e N come equivalenti (cobordanti) se esse costituiscono il 
bordo di una stessa varietà WW. Questa equivalenza è operatoriale nella misura in 
cui, come ha mostrato Thom, l’insieme delle classi di equivalenza può essere mu- 
nito di una struttura di gruppo. Quanto alla teoria di Morse, essa consiste nell’a- 
nalizzare le applicazioni differenziabili f: M +R di una varietà /M nella retta rea- 
le. Tale teoria è presentata nell’articolo « Locale/globale » (cfr. anche « Applicazio- 
ni»). L’idea direttrice è che, benché una tale funzione f: M +R possa essere estre- 
mamente complicata, tuttavia è relativamente semplice quando è strutturalmen- 
te stabile, vale a dire di tipo differenziabile invariante per piccole deformazioni. I 
due teoremi di base della teoria sono da una parte il teorema di Morse che af- 
ferma che, se M è compatta, f è strutturalmente stabile se e solo se i suoi punti 
critici sono non-degeneri (il che implica che siano isolati) e i suoi valori critici 
sono tutti distinti (caratterizzazione geometrica della stabilità strutturale), e dal- 
l’altra il teorema (corollario del teorema di trasversalità di Thom) che afferma 
che le applicazioni strutturalmente stabili sono dense (e anche generiche) dato 
che ogni applicazione è approssimabile da una applicazione strutturalmente sta- 
bile. Considerevolmente sviluppata da Thom, questa teoria è alla base della teo- 
ria delle catastrofi (cfr. l’articolo «Locale/globale»: nozione di dispiegamento 
universale). Nella misura in cui le applicazioni stabili (dette anche di Morse) 
f:M4+R sono quelle che permettono di definire una presentazione ad anse di 14, 
tale teoria ha avuto un ruolo determinante nella dimostrazione di Smale del teo- 
rema dell’%-cobordismo che è il primo grande risultato che riguarda la congettu- 
ra di Poincaré. 

La congettura di Poincaré (una delle grandi congetture del secolo) domanda 
in quale misura, per le sfere S”, il livello omotopico-omologico determina il livel- 
lo topologico: se M è una varietà compatta di dimensione n semplicemente con- 
nessa (7t,(M7)=0) e che ha l’omologia di 6”, è M omeomorfa a 5"? La congettu- 
ra è vera per n=2 (dimostrazione elementare). Smale ha dimostrato che è vera 
per n= 5. La tecnica è un teorema sul cobordismo. Si dice che due varietà M e N 
sono h-cobordanti se sono il bordo di una varietà W e se le inclusioni canoniche 
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MW e NW sono delle equivalenze di omotopia. Il teorema di Smale afferma 
che se dim M= dim N25 e se Me N sono semplicemente connesse, allora un 
h-cobordismo W è necessariamente zriviale, cioè diffeomorfo a M xI. Ciò im- 
plica che M e N sono diffeomorfe. La tecnica consiste nel partire da una funzione 
di Morse su W definendo una presentazione ad anse e nel mostrare come si pos- 
sano sopprimere progressivamente le anse (cfr. l'articolo Unità delle matemati- 
che in questo stesso volume dell’Enciclopedia). 

La considerazione delle funzioni di Morse porta al problema della classifica- 
zione delle applicazioni differenziabili f: M +N tra due varietà qualunque (M # 
#R). Queste applicazioni non sono localmente triviali quando possiedono delle 
singolarità. L'idea è quella di tentare 1) di caratterizzare geometricamente e di 
classificare le applicazioni strutturalmente stabili in modo da controllare le cause 
d’instabilità; 2) di mostrare che le applicazioni stabili sono generiche, cioè che 
ogni applicazione è stabilizzabile con una piccola deformazione; 3) di classificare 
le applicazioni instabili con un grado crescente di instabilità; 4) di utilizzare dei 
metodi di riduzione alla dimensione finita (tecnica dei getti) considerando Ie ap- 
plicazioni che hanno lo stesso tipo differenziabile di uno dei loro getti di ordine 
finito; 5) di trattare questi problemi prima localmente (mediante germi di appli- 
cazioni) e poi globalmente (cfr. gli articoli « Locale/globale », « Applicazioni» e 
+Funzioni +). 


3. I livelli analitici e algebrici. 


Una delle caratteristiche del livello differenziabile è che non esiste solidarie- 
tà tra il locale e il globale. Di qui l’importanza cruciale della stabilità strutturale 
che restaura tale solidarietà. Non accade affatto la stessa cosa per quanto riguar- 
da i livelli molto più vincolanti, analitico e algebrico, in cui al contrario il locale 
determina il globale. In questo caso le principali tecniche di passaggio dal loca- 
le al globale sono il prolungamento analitico e la coomologia a valori in un fascio 
(cfr. gli articoli «Geometria e topologia», «Invariante», « Trasformazioni natu- 
rali / categorie »). Esiste, a partire dai lavori pionieristici di Riemann, una gran 
quantità di relazioni di dipendenza e di determinazione reciproca tra i livelli to- 
pologico, differenziabile, analitico e algebrico. Per esempio una sottovarietà ana- 
litica di uno spazio proiettivo P*(C) è algebrica (teorema di Riemann per le cur- 
ve e teorema di Chow per le varietà generali). Il genere di una curva algebrica 
piana che è il suo invariante topologico maggiore è derivabile dal grado della cur- 
va (formula di Riemann). Esso vincola anche il numero di forme differenziali di 
prima specie indipendenti (teorema di Riemann che stabilisce un legame tra li- 
vello topologico, livello differenziabile e livello analitico). La coomologia di una 
varietà differenziabile è esprimibile a partire dal teorema di Stokes in termini di 
forme differenziali sulla varietà (teorema di De Rham). Se la varietà è analitica, 
essa è anche esprimibile, ma lo è in termini di forme armoniche (teoria di Hodge 
che collega il livello differenziabile e il livello analitico), ecc. Tutti questi temi 
che costituiscono il cuore della geometria analitica e algebrica moderna oltrepas- 
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sano il contenuto del gruppo di articoli qui esaminato e sono affrontati in altri 
articoli dell’ Enciclopedia. 


4. Equazioni differenziali e analisi globale. 


Una delle teorie in cui la dialettica +locale/globale + è maggiormente impor- 
tante è la teoria delle equazioni differenziali. Innumerevoli problemi concreti 
(fisica, chimica, biologia, ecc.) conducono a sistemi di equazioni differenziali de- 
finiti nel modo seguente. Il sistema considerato è definibile con un numero finito 
%1, «+, Xy di coordinate che descrivono una varietà differenziabile M di dimen- 
sione N detta spazio delle fasi del sistema. Uno stato istantaneo del sistema è 
dunque rappresentato da un punto x di /M e l'evoluzione del sistema a partire da 
una condizione iniziale xe M con un cammino x(t) in M che parte da x). Asse- 
gnare una legge di evoluzione significa assegnare, in ogni punto x di M, un vetto- 
re velocità dx/dt in funzione di x e di #: dx/dt=f(x,t). Questo vettore velocità è 
un vettore tangente in x a MM, cioè un vettore dello spazio vettoriale tangente 
T.,M di M in x. Se f non dipende dal tempo (il sistema di equazioni differenziali è 
detto allora autonomo), assegnare una legge di evoluzione f equivale dunque ad 
assegnare una sezione del fibrato tangente 7 di M. In generale si suppone che 
questa sezione sia differenziabile. Ma essa può essere più analitica o algebrica 
se M è una varietà analitica o algebrica. 

Data una sezione differenziabile X(x) di TM (detta anche campo di vettori 
su M), si chiama trazettoria del campo X una curva differenziabile di M para- 
metrizzata dal tempo #, la quale, in ogni punto x di M, ammette X(x) come vet- 
tore velocità. Il primo teorema fondamentale della teoria afferma che se x,€ M è 
una condizione iniziale, esiste sempre localmente una e una sola traiettoria pas- 
sante per xy (principio del determinismo). Il secondo dice che sotto condizioni 
abbastanza generali (per esempio se /M è compatta) esiste anche sempre una e 
una sola traiettoria globale (cioè parametrizzata da {= — co a f= +-co). In questo 
caso si può associare a X ciò che viene chiamato il suo flusso, vale a dire un’entità 
globale che sintetizza l'insieme delle traiettorie. Infatti se te R, a xe M si può as- 
sociare il punto x, raggiunto alla fine del tempo # sulla traiettoria uscente da x. 
Per # fissato, l’applicazione p;: MM +M che a x associa x, è un diffeomorfismo di 
M, in altre parole un elemento @,e Diff.M in cui Diff M è il gruppo di Lie dei 
diffeomorfismi di M. È facile verificare che @y è l’identità di M e che i diffeo- 


morfismi g; soddisfano @,,00,=@y,;. In altre parole l’applicazione di 139, è 
un morfismo di gruppi di Lie tra il gruppo additivo di R e DiffM. Reciproca- 


i : ì < i . d 
mente, assegnata D si può ritrovare X, poiché X è la «derivata» Pl del 


morfismo È in f=o0. t=0 

Se si discretizza il tempo, si può considerare il diffeomorfismo p=%@, e ap- 
prossimare il sistema dinamico ® con la successione iterata 9" di ©. 

Mentre per lungo tempo si è cercato di trovare formule esplicite per le traiet- 
torie di un sistema dinamico X, dopo Poincaré si cerca di comprendere qualita- 
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tivamente la struttura del flusso D associato (cfr. l'articolo «Qualità/quantità»). 
Perciò si è portati a distinguere un approccio locale e un approccio globale. A 
priori si può pensare che, essendo dato un sistema dinamico X su M, le sue 
traiettorie siano immersioni (o almeno applicazioni iniettive) di R in M. Ma ciò 
è falso perché alcune traiettorie possono essere critiche. Sono possibili due casi. 
O la traiettoria è ridotta a un punto xy e allora questo punto, detto punto critico 
di X, è un punto di equilibrio del sistema. Per questo è necessario e sufficiente 
che X si annulli in x. Oppure la traiettoria è chiusa, vale a dire periodica. Dato 
che si può mostrare che, in un punto xe M in cui X(x)740, X è localmente triviale 
(cioè riducibile a un campo costante in un sistema appropriato di coordinate lo- 
cali), si vede che lo studio di X si scompone in tre parti: 


1) Lo studio locale di X nell’intorno dei suoi punti critici. 

2) Lo studio semilocale di X nell’intorno delle sue traiettorie periodiche. 

3) Lo studio globale di X che comprende la configurazione delle sue traietto- 
rie critiche e lo studio d’insieme delle sue traiettorie non critiche. 


Per quanto riguarda il primo punto, la tecnica di base consiste, in un punto 
critico x, di X, nello studiare il campo lineare X, tangente in x, a X e nel cercare 
sotto quali condizioni X è equivalente nell’intorno di x, alla sua parte lineare. 
Se non si ha questo caso, si cercheranno allora (come nello sviluppo di Taylor 
delle funzioni) delle approssimazioni pit sottili. Per quanto riguarda il secondo 
punto, si cercheranno in primo luogo dei criteri che permettano di garantire l’e- 
sistenza di traiettorie periodiche in un certo dominio di M. Data una tale traiet- 
toria yy, lo studio di X nell'intorno di yo si riduce ad uno studio locale. Sia infatti 
W una piccola sezione trasversa a yo in xp. L'applicazione che ad ogni punto x 
di W associa il punto x' in cui la traiettoria uscente da x interseca per la prima 
volta W è un diffeomorfismo di W che ammette x, come punto fisso. È dunque 
sufficiente analizzare questo diffeomorfismo nell’intorno di x, per comprendere 
la struttura di X nell’intorno di yy. Per quanto riguarda il terzo punto, si cerche- 
rà di analizzare i vincoli che la topologia di M impone alla ripartizione delle 
traiettorie critiche. Ma si cercherà soprattutto di analizzare il comportamento 
asintotico delle traiettorie non critiche cosî come. la stabilità delle traiettorie. In- 
tuitivamente una traiettoria è stabile se ogni traiettoria generata da una condi- 
zione iniziale prossima a uno dei suoi punti le resta indefinitamente prossima. 
Questa stabilità è essenziale per le applicazioni perché è quella che assicura che 
il determinismo matematico ideale del campo ha un senso concreto (cfr. l’arti- 
colo + Stabilità/instabilità +). Esistono infatti dei sistemi in cui tutte le traiettorie 
sono instabili e che dunque sono sistemi matematicamente deterministici e tutta- 
via concretamente stocastici. ; 

Infine si cercherà di applicare allo studio qualitativo dei sistemi dinamici il 
paradigma catastrofista sviluppato per lo studio delle applicazioni differenziabili 
(cfr. l’articolo +Locale/globale +). Si cercherà in particolare di caratterizzare geo- 
metricamente la stabilità strutturale dei campi (da non confondere con la stabi- 
lità delle traiettorie), di studiare la ripartizione dei campi stabili tra i campi qua- 
lunque cosî come le possibilità di passare da un tipo di campo stabile a un altro 
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attraversando campi instabili (teoria della biforcazione). Si tratta di un pro- 
gramma immenso, di una tremenda complessità, che si trova in parte esposto 
negli articoli +Differenziale+ e + Stabilità/instabilità +. 


5. Meccanica hamiltoniana. 


‘Tra le equazioni differenziali, quelle che provengono dalla meccanica classi- 
ca sono molto particolari. In questo caso il sistema è rappresentato da un numero 
finito di coordinate generalizzate g,, ..., 9, che percorrono uno spazio (detto spa- 
zio delle configurazioni) M e dai momenti pi, ..., pp associati. Lo spazio delle fasi 
del sistema è allora il fibrato cotangente T*M di M. Come è stato mostrato da 
Hamilton, le equazioni differenziali del secondo ordine (del tipo dell’equazione 
di Newton f= mm) che regolano l’evoluzione del sistema, sono allora traducibili 
in un formalismo canonico. Se H(g, p) è l'energia del sistema, energia indipen- 
dente dal tempo, e se il sistema è conservativo (non dissipativo, senza attrito), 
le equazioni di evoluzione sono date dalle celebri formule di Hamilton (dg/dt = 
=0dH[òp, dp/dt=—dH]dq). Ciò implica non soltanto la conservazione dell’e- 
nergia, ma la conservazione del volume dello spazio delle fasi (teorema di Liou- 
ville). Questo fatto è fondamentale perché implica l'impossibilità per un siste- 
ma hamiltoniano di possedere attrattori e, con ciò stesso, l’esistenza di forti pro- 
prietà di ergodicità. 

Essendo conservativi, i sistemi hamiltoniani sono strutturalmente instabili. 
Si pone dunque il problema di sapere come si stabilizzano quando si introduce 
della dissipazione. D'altra parte, se ci si limita ai campi hamiltoniani, alcuni cam- 
pi diventano stabili. Ma non tutti. Tra i campi instabili restano in particolare i 
campi detti integrabili che possiedono un numero massimale di integrali primi 
indipendenti. Si pone dunque il problema di sapere come un campo integrabile 
può stabilizzarsi all’interno della classe dei sistemi hamiltoniani. È la teoria delle 
perturbazioni (cfr. l’articolo «Stabilità/instabilità »). 

Si noterà infine che il formalismo hamiltoniano consiste nel pensare la mec- 
canica in analogia con l’ottica geometrica. Ora, è noto che in ottica i raggi lumi- 
nosi non sono nient’altro che le geodetiche per una struttura riemanniana che 
esprime le proprietà ottiche del mezzo. Succede la stessa cosa in meccanica. Le 
traiettorie definite localmente con le equazioni di Hamilton possono anche esse- 
re definite globalmente a partire da un principio variazionale detto principio di 
minima azione (cfr. l'articolo *+Variazione +). Si tratta in questo caso di una delle 
più spettacolari equivalenze tra determinazione locale e determinazione globale. 


6. Conclusione. 


Queste poche elementari generalità sulla dialettica del locale e del globale 
rinviano evidentemente soltanto ad alcuni di questi aspetti. Per maggior com- 
pletezza, occorrerebbe parlare in particolare: 1) dell’intervento di questa dialet- 
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tica in aritmetica e in teoria dei corpi di classe: si tratta in questo caso infatti di 
un esempio particolarmente sorprendente, profondo e operatorio di transfert di 
una concettualità dal suo dominio di origine a un dominio che, apparentemente, 
le è estraneo (si veda l’articolo *+Locale/globale +); 2) del ruolo considerevole che 
hanno le considerazioni qui appena abbozzate nell’analisi funzionale e in parti- 
colare nella teoria delle equazioni alle derivate parziali cosi fondamentale per la 
fisica (cfr. gli articoli + Differenziale + e + Funzioni +); 3) delle tecniche di localiz- 
zazione e di globalizzazione in algebra commutativa, tecniche fondamentali per 
la geometria algebrica. 

Si spera che queste osservazioni siano sufficienti a mostrare che l’opposizione 
locale/globale possiede un eminente valore categoriale, costituendo uno dei punti 
focali di ciò che Lautman chiamava l’unità (concettuale) della matematica. [J.P.]. 
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Il termine ‘differenziale’ è molto usato nella matematica, da solo od in 
connessione ad altri termini. Si parla ad esempio di calcolo differenziale, di 
differenziale di una funzione, di equazione differenziale, di forma differenziale. 

In questo articolo verranno trattate le equazioni differenziali e le forme 
differenziali. Per gli altri significati con i quali il termine viene usato, il lettore 
è rimandato ai rispettivi articoli. 

L’articolo « Differenziale» è suddiviso in quattro paragrafi nei quali, in 
sostanza, si esplica una suddivisione tra equazioni differenziali e forme dif- 
ferenziali. I primi tre paragrafi — equazioni differenziali ‘ordinarie, equazioni 
alle derivate parziali, calcolo delle variazioni — sono da riferirsi alla prima 
parte, il quarto è interamente dedicato alle forme differenziali. Questa suddi- 
visione viene effettuata per ragioni di chiarezza espositiva, ma può anche giu- 
stificarsi con una relativa indipendenza dei due argomenti. In effetti, mentre 
le equazioni differenziali sorgono contemporaneamente al calcolo differenziale, 
le forme differenziali sono molto più recenti, in quanto la loro origine si colloca 
tra la fine del secolo scorso e l’inizio del nuovo secolo. 

La suddivisione dei tre paragrafi iniziali, invece, è totalmente di carattere 
espositivo. Infatti i problemi che vi si trattano sono di natura molto simile. 
In molti casi — ad esempio nell'equazione delle corde vibranti — si passa da 
una formulazione nell’ambito della teoria delle equazioni differenziali ordinarie 
ad una formulazione come equazione alle derivate parziali. Spesso poi, nella 
risoluzione di un problema, si passa da un campo all’altro. Ad esempio il 
problema della brachistocrona si formula nell’ambito del calcolo delle varia- 
zioni e conduce poi ad un’equazione differenziale ordinaria. 

Le prime equazioni differenziali ordinarie compaiono in matematica alla 
fine del secolo xvII e sono perciò quasi contemporanee al sorgere del calcolo 
differenziale. In effetti esse sono già presenti in opere di Leibniz e di Newton, 
cioè di coloro che tradizionalmente sono indicati come i fondatori di questo 
calcolo. : 

Naturalmente non si può parlare all’inizio di una «teoria» delle equazioni 
differenziali ordinarie; esse compaiono occasionalmente e sporadicamente nel- 
l’opera dei singoli ricercatori. Tuttavia ben presto vengono trattate con mol- 
ta maggiore sistematicità. Si può dire che già nel secolo xvi si configura 
una teoria delle equazioni differenziali come un oggetto unitario all’interno del 
calcolo differenziale. Nel secolo xIx e successivamente questa teoria acquisterà 
sempre maggiore consistenza e sistematicità, ma non altererà sostanzialmente 
la sua natura. 

Le ricerche intorno alle equazioni differenziali sono motivate all’inizio e 
nel secolo successivo da numerosi problemi fisici. Vanno citati anzitutto quelli 
relativi alla teoria della elasticità: si tratta di trovare la forma od il movimento 
di travi, funi, piastre, ecc. sottoposte a sollecitazioni di varia natura. Questi 
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problemi erano stati trattati in maniera empirica dai costruttori medievali. 
Poi per opera di molti scienziati quali Galileo, Edme Mariotte, Robert Hooke 
ed altri, erano state formulate leggi matematiche di natura sperimentale. Ora, 
con l’aiuto potente del nuovo calcolo differenziale, è possibile formulare questi 
problemi in termini di equazioni differenziali. . 

Vanno ancora citati due problemi importanti del secolo xv: il problema 
della forma della Terra e quello della verifica della legge di attrazione gravita- 
zionale di Newton. Poiché entrambi questi problemi sono connessi con il 
comportamento del pendolo e questo viene descritto con una equazione dif- 
ferenziale, si capisce come lo studio di essa debba dar luogo ad importanti 
sviluppi. 

Va ancora citato un importantissimo campo di ricerche, e questo non solo 
nel secolo xvi, ma anche successivamente: quello della meccanica celeste. In- 
fatti la meccanica celeste è stata la prima scienza le cui leggi siano state espres- 
se come equazioni differenziali. 

Partendo da considerazioni sulle soluzioni di queste equazioni differenziali 
si è stati in grado, conoscendo certe informazioni circa la posizione e la velocità 
dei corpi ad un dato istante, di predire il verificarsi di certi fenomeni naturali, 
come le eclissi. Naturalmente questi successi della meccanica celeste hanno 
avuto una parte importante nella creazione di un modo di vedere scientifico. 
Si può dire che il determinismo, enunciato per la prima volta esplicitamente 
da Laplace, abbia avuto in essa il suo fondamento. 

La seguente citazione, tratta dall’Essai philosophique sur les probabilités 
potrebbe essere utilizzata come «manifesto» del determinismo: «Un’Intelli- 
genza che, per un dato istante, conoscesse tutte le forze da cui è animata la 
natura e la situazione rispettiva degli esseri che la compongono, se per di pit 
fosse abbastanza profonda per sottomettere questi dati all'analisi, abbraccerebbe 
nella stessa formula i movimenti dei più grandi corpi dell’universo e dell'atomo 
più leggero: nulla sarebbe incerto per essa e l'avvenire, come il passato, sarebbe 
presente ai suoi occhi» [1814, trad. it. p. 243]. 

Non potrebbe esservi formulazione pit esplicita! Ma anche il proseguimento 
di essa è molto interessante, poiché mostra appunto come l’astronomia con i 
suoi successi si ponga a fondamento di questa concezione filosofica: «Lo spirito 
umano offre, nella perfezione che ha saputo dare all’astronomia, un pallido 
esempio di quest’Intelligenza. Le sue scoperte in meccanica e in geometria, 
unite a quella della gravitazione universale, l'hanno messo in grado di abbrac- 
ciare nelle stesse espressioni analitiche gli stati passati e quelli futuri del sistema 
del mondo» [ibid.]. 

Poiché le leggi della meccanica celeste sono formulate mediante equazioni 
differenziali, si capisce bene l’importanza che esse vengono ad avere. 

Con questo non si vuole sostenere, naturalmente, che le equazioni differen- 
ziali — come qualsiasi altra teoria matematica — possano porsi a fondamento di 
una concezione filosofica. È certo, però, che la teoria delle equazioni differen- 
ziali è uno degli strumenti più importanti per l'indagine e la formulazione dei 
problemi fisici. Ancora dalla meccanica celeste proviene, verso la fine del se- 
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colo scorso, un importante impulso per la evoluzione della teoria delle equa- 
zioni differenziali. 

Un problema fondamentale della meccanica celeste è quello degli x corpi, 
cioè della determinazione del movimento di x corpi di masse date soggetti 
all’attrazione gravitazionale. Si tratta di una idealizzazione del movimento del 
sistema solare. Questo problema può essere tradotto in un sistema di equazioni 
differenziali 


dx; 
7 Sv %g, «++ Xn) 


che, per la sua forma particolare — nelle f; non compare il tempo — viene detto 
sistema autonomo. 

In base al teorema di esistenza ed unicità, le equazioni della meccanica 
celeste — essendo dotate di molte proprietà specifiche, quale ad esempio l’esi- 
stenza di un integrale dell'energia — ammettono una ed una sola soluzione, 
quando vengano specificate le condizioni iniziali in un certo istante di tempo. 

Da un certo punto di vista, quindi, noi «abbiamo » la soluzione del problema; 
si tratta di integrare il sistema. Ma «integrare il sistema» in questo caso può 
voler dire molto poco. Infatti anche nei casi fortunati in cui questo è possibile 
con funzioni elementari, si ottengono espressioni cosî complicate da essere pra- 
ticamente inutilizzabili. 

Anche il tentativo di fornire la soluzione mediante sviluppi in serie si rivela 
inefficace, poiché le serie-soluzione possono convergere cosî lentamente da es- 
sere del tutto inutili. 

Poi, i metodi che abbiamo accennato sono in linea di principio insoddisfa- 
centi dal punto di vista dell'astronomia, anche quando venissero potenziati con 
i moderni strumenti di calcolo. Infatti la richiesta tipica, in questo caso, non è 
quella di avere soluzioni in un dato intervallo, ma di avere soluzioni in grande. 

Si pone cosi uno dei temi più importanti della teoria qualitativa delle equa- 
zioni differenziali: determinare le proprietà delle soluzioni direttamente dalle 
equazioni differenziali, senza passare attraverso le soluzioni. 

Vanno segnalati tuttavia due casi nei quali la situazione è diversa: il caso 
importantissimo dei due corpi che verrà trattato in un apposito paragrafo, 
mostrando come dalla legge di Newton si deducano le leggi di Keplero, e la 
soluzione particolare del problema dei tre corpi data da Lagrange (1772). 

La soluzione di Lagrange mostra la possibilità di un movimento uniforme 
lungo orbite circolari, in un piano fisso, a partire da una configurazione nella 
quale i tre corpi occupano i vertici di un triangolo equilatero. Questa soluzione, 
giudicata poco significativa dallo stesso Lagrange, ha trovato interesse recente- 
mente poiché si è osservato come il Sole, Giove, ed i pianeti del gruppo troiano 
formino approssimativamente un triangolo equilatero. Diviene cosi importante 
studiare il comportamento di soluzioni «vicine» a quella lagrangiana. 

Un contributo importante all’evolversi della teoria qualitativa delle equa- 
zioni differenziali verrà, nel xx secolo, da radio-fisica e radio-ingegneria. 

Nella teoria classica si poneva in maniera naturale il problema dell’esistenza 
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di soluzioni oscillanti, collegate a fenomeni meccanici nei quali le oscillazioni 
erano un fenomeno da evitare. Nel campo della radio-fisica e della radio- 
ingegneria si ha spesso il fenomeno contrario: è molto importante generare 
oscillazioni. Poiché spesso i dispositivi utilizzati per generare oscillazioni sono 
indipendenti dal tempo, si capisce come, descritti con equazioni differenziali 
che nella maggior parte dei casi non sono lineari, diano luogo a sistemi auto- 
nomi, non-lineari, appunto. 

La esigenza di una teoria qualitativa delle equazioni differenziali fu avvertita 
con grande chiarezza da Henri Poincaré, il quale ebbe a scrivere: «Lo studio 
completo di una funzione comprende due parti: 1) una parte qualitativa (per 
cost dire) o studio geometrico della curva definita dalla funzione; 2) una parte 
quantitativa o calcolo numerico dei valori della funzione. 

«Cosf per esempio, per studiare una equazione algebrica si comincia con 
il ricercare, con l’aiuto del teorema di Sturm, quale è il numero delle radici 
reali: è la parte qualitativa; poi si calcola il valore numerico delle sue radici, 
ciò che costituisce lo studio quantitativo della equazione. 

«Allo stesso modo, per studiare una curva algebrica, si comincia con il 
“costruire’’ questa curva, come si dice nel corso di Matematiche Speciali, 
cioè si cercano i rami di curva chiusa, i rami infiniti eccetera. Dopo questo 
studio qualitativo della curva se ne possono determinare esattamente un certo 
numero di punti. È, naturalmente con la parte qualitativa che si deve abbordare 
la teoria di ogni funzione ed è per questo che il problema che si presenta in 
primo luogo è costruire le curve definite dalle equazioni differenziali... D'altro 
lato questo studio qualitativo avrà di per sé un interesse di prim'ordine... 
Prendiamo per esempio il problema dei tre corpi: non ci si può domandare se 
uno dei corpi resterà sempre in una certa regione del cielo o se potrà allontanar- 
sene indefinitamente; se la distanza dei corpi aumenterà o diminuirà all’infinito 
o se resterà compresa entro certi limiti? Non ci si possono porre mille questioni 
di questo genere che saranno tutte risolte quando si saprà costruire qualitati- 
vamente le traiettorie dei tre corpi?» [1901, ed. 1928 p. xxII]. 

In precedenza egli aveva anche osservato: « Una teoria completa delle fun- 
zioni definite dalle equazioni differenziali sarebbe di grande utilità in un gran 
numero di questioni di matematica pura o di meccanica. Purtroppo, è evidente 
che, nella grande generalità dei casi che si presentano, non si può integrare 
queste equazioni con l’aiuto di funzioni già conosciute, per esempio con l’aiuto 
di funzioni definite con le quadrature. Se ci si volesse dunque restringere ai 
casi che si possono studiare con integrali definiti o indefiniti, il campo delle 
nostre ricerche sarebbe singolarmente diminuito, e l'immensa maggioranza del- 
le questioni che si presentano nelle applicazioni resterebbe insolubile. 

«È dunque necessario studiare le funzioni definite dalle equazioni differen- 
ziali in se stesse e senza cercare di ricondurle a funzioni più semplici, cosi 
come si è fatto per le funzioni algebriche, che si era cercato di ricondurre ai 
radicali e che si studiano ora direttamente, cosi come si è fatto per gli integrali 
dei differenziali algebrici, che ci si è sforzati per lungo tempo di esprimere in 
termini finiti» [1881, p. 375]. 
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Anche le equazioni alle derivate parziali, come le equazioni differenziali 
ordinarie, sono quasi contemporanee al sorgere del calcolo differenziale. 

È molto importante rilevare questo fatto. I problemi del calcolo differen- 
ziale sono quasi tutti presenti fin dall'inizio anche se talvolta, naturalmente, 
in forma rudimentale. Problemi di equazioni differenziali ordinarie, di equa- 
zioni alle derivate parziali, di calcolo delle variazioni, di calcolo integrale, 
ecc. sono presenti nell'opera dei ricercatori del secolo xVII «tutti assieme». 

Con i successivi sviluppi del calcolo differenziale, questi argomenti si dif- 
ferenzieranno in teorie separate; ognuno di questi argomenti diverrà oggetto 
di trattazioni specialistiche, ed anzi si porranno anche ulteriori suddivisioni. 
Oggi, per esempio, abbiamo interi trattati sulle equazioni alle derivate parziali 
di un particolare tipo, come le equazioni ellittiche, trattati sulle funzioni- 
soluzione di una particolare equazione differenziale, sulle funzioni ellittiche, 
sui polinomi di Legendre. 

Però, per intendere bene lo sviluppo ed il concetto del calcolo differenziale 
occorre avere ben presente come queste teorie siano suddivisioni di una unità ori- 
ginaria e non oggetti diversi scollegati fra loro, come può succedere di pensare 
quando se ne affronta lo studio su trattati organizzati in maniera specialistica. 

Anche per le equazioni alle derivate parziali le maggiori motivazioni si 
hanno all’inizio in riferimento a problemi fisici. 

In effetti la teoria delle equazioni alle derivate parziali risente in maniera 
notevolissima dei contatti con la fisica. Infatti la fondamentale «classificazione » 
delle equazioni alle derivate parziali — della quale si vedranno nel $ 2.2 gli 
aspetti tecnici, soprattutto in riferimento alle equazioni del secondo ordine — 
è fondata sulla diversa natura dei fenomeni fisici che vengono descritti. Si 
vedrà come le equazioni alle derivate parziali possano suddividersi in «iper- 
boliche», «ellittiche» e «paraboliche». Le prime descrivono fenomeni di pro- 
pagazione ondosa: tipica in questo senso è l’equazione della corda vibrante, 
o più in generale l'equazione delle onde. Le equazioni paraboliche descrivono 
invece fenomeni di lenta diffusione: ancora tipica in questo senso è l'equazione 
del calore. Delle equazioni ellittiche si tratterà in maniera abbastanza detta- 
gliata nel $ 2.3, cui è rimandato il lettore che voglia farsi un’idea precisa dello 
stretto contatto esistente tra matematica e fisica, e al tempo stesso della natura 
delle equazioni ellittiche. Basterà qui osservare che esse descrivono fenomeni 
stazionari. 

Tornando ad un’argomentazione più legata alla tecnica della descrizione 
matematica, si vuol qui osservare come, talvolta, un problema fisico, trattato 
dapprima in forma drasticamente semplificata, dia origine a un’equazione dif- 
ferenziale ordinaria. Trattato poi in forma meno schematica, esso fornisce 
un'equazione alle derivate parziali. Un esempio molto illuminante è quello 
dell’equazione delle corde vibranti. 

Questo problema è anche importante poiché diede origine nel xvIII secolo 
a un’aspra polemica, la quale riguardava in sostanza la possibilità di rappresen- 
tare una funzione arbitraria mediante una serie trigonometrica. Questa possi- 
bilità era sostenuta da Daniele Bernoulli, il quale portava motivi fisici a sostegno 
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di questa tesi, ed era invece aspramente osteggiata da molti dei migliori mate- 
matici del tempo, quali Eulero e d’Alembert. Questa polemica ebbe molta 
importanza per lo sviluppo del concetto di funzione e praticamente segnò 
l’inizio di quell’ordine d’idee che condusse alla serie di Fourier. 

Il fatto cui si è accennato — di come un’equazione alle derivate parziali 
possa presentarsi come una formulazione più «sofisticata» di un problema — 
può suggerire l’idea che la teoria delle equazioni alle derivate parziali sia una 
generalizzazione della teoria delle equazioni differenziali ordinarie; e questo 
in un certo senso è vero, non foss’altro che per il fatto che un’equazione differen- 
ziale ordinaria è una particolare equazione alle derivate parziali. Però il fatto 
che una teoria possa essere considerata una generalizzazione di un’altra non 
esaurisce affatto il problema del rapporto tra le teorie, il quale va inteso in modo 
dialettico, e non di semplice subordinazione. 

Per esempio —- in un altro contesto — una struttura matematica molto im- 
portante, quella di categoria, è un caso particolare di un’altra struttura, quella 
di grafo, ma questo non significa affatto che la teoria delle categorie possa in 
qualche modo essere vista come un caso particolare della teoria dei grafi. 
Vi sono dei problemi tipici di teoria delle categorie assolutamente impensabili 
in termini di grafi. 

Cosî per le equazioni alle derivate parziali si può osservare come i numerosi 
successi ottenuti con il metodo della separazione di variabili, che riducono 
l'equazione ad un sistema di equazioni differenziali ordinarie, suggerirà, verso 
la metà dell’Ottocento, l’opinione che un’equazione alle derivate parziali sia 
una formulazione compatta di un sistema di equazioni differenziali ordinarie 
e che quindi la teoria delle equazioni alle derivate parziali debba subordinarsi 
a quella delle equazioni differenziali ordinarie. 

Dopo questo accenno alla teoria delle equazioni differenziali ordinarie e a 
quella delle equazioni alle derivate parziali, qualche considerazione ora su 
un’importante categoria del pensiero matematico, l'opposizione lineare/non- 
lineare. Essa si esplica in vari campi della matematica; si parla di equazioni 
differenziali lineari e non-lineari, di equazioni alle derivate parziali lineari e 
non-lineari, di equazioni algebriche lineari e non-lineari. Per cogliere dunque 
nella sua specificità il senso di questa opposizione occorre riferirsi alle tratta- 
zioni tecniche che verranno date successivamente. Tuttavia è certamente utile 
premettere qualche osservazione. 

La trattazione «lineare» di un problema si riferisce «grosso modo» ad 
una sua fase preliminare, nella quale vengono effettuate notevoli semplifica- 
zioni, e questo non è certo peculiare della matematica, poiché in ogni scien- 
za si considerano, dapprima, modelli semplificati. Ma ciò che è tipicamen- 
te riflesso nella opposizione lineare/non-lineare è la consapevolezza di come 
un piccolo incremento quantitativo, pur alterando il fenomeno esaminato, 
non ne alteri il comportamento «qualitativo». Si parla in questo caso di « per- 
turbazione» del procedimento lineare. Un maggiore incremento quantitativo 
altera invece sostanzialmente il fenomeno in esame. Si passa alla fase non- 
lineare. Nel caso poi che un fenomeno venga descritto in forma differenziale 
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- la differenziazione essendo in effetti un procedimento di linearizzazione -, 
si ha che la prima fase esplicativa è «lineare» in senso tecnico, descritta cioè 
con algoritmi di primo grado. Nelle fasi più approfondite tale particolarità va 
naturalmente perduta. Questo fenomeno verrà descritto con un esempio molto 
semplice — l'equazione di sviluppo della popolazione — nel paragrafo introdut- 
tivo alle equazioni differenziali. 

Anche il calcolo delle variazioni, all’inizio, era indistinguibile dal calcolo 
differenziale vero e proprio. I nomi di molti dei matematici che possono 
riguardarsi come i fondatori del calcolo differenziale sono legati ai primi 
problemi classici del calcolo delle variazioni. Un primo problema fu posto 
dallo stesso Newton: quello della forma migliore da dare ad un oggetto che 
debba muoversi in un fluido per vincerne la resistenza. Un altro problema 
molto celebre (cfr. $ 3.1) fu posto da Giovanni Bernoulli nel 1696 sugli «Acta 
Eruditorum»: quello della brachistocrona. Soltanto nel secolo xvIII, con Eulero 
e Lagrange, il calcolo delle variazioni diverrà una disciplina autonoma. 

Va osservato ancora come nel secolo xviri il calcolo delle variazioni verrà 
a legarsi a principî scientifici e filosofici di grande importanza riassumibili 
nella formulazione di leggi naturali che esprimono in qualche modo l’«econo- 
micità» della natura. 

Già nell’antichità classica si trovano formulate leggi naturali di questo tipo. 
Ad Erone si deve la legge seguente: la luce, proveniente da una sorgente P 
si riflette su uno specchio R e giunge ad un punto Q in modo che il percorso 
PRO sia il più breve possibile. 

La formulazione di leggi naturali nello stesso ordine di idee, sia in casi 
specifici sia come principî generali, dall'antichità classica trascorre in tutta la 
tradizione scientifica fino al secolo xvi. A partire da questo periodo, la possi- 
bilità di disporre di strumenti matematici più potenti permette di formulare 
dei «principî» più generali e penetranti. 

Il principio del minimo tempo di Fermat è in accordo con la legge di rifra- 
zione della luce. Se 2, e v, rappresentano le velocità della luce in due mezzi 
differenti ed i e r rappresentano gli angoli d’incidenza, da questo principio 
si deduce la legge 

sinî 
siny vg, 

Anche la dinamica newtoniana — che stabilisce come la linea retta, cioè la 
più breve distanza, sia il moto naturale di un corpo — può interpretarsi come 
un principio nello stesso ordine di idee. 

Una prima formulazione di un principio di portata molto generale, tale 
da potersi ritenere esplicativo di gran parte dei fenomeni naturali, fu formula- 
to da Maupertuis: il principio di minima azione. Questo principio, formulato 
dall’autore in maniera non ancora del tutto chiara dal punto di vista mate- 
matico, sebbene completamente intelligibile dal punto di vista filosofico, fu 
utilizzato con successo soprattutto da Lagrange, per ricavare le sue celebri 
equazioni di movimento. 
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Le equazioni di Lagrange verranno trattate più avanti ($ 3.3), insieme 
con il principio di Hamilton. Anche quest’ultimo è di grandissima importanza 
per la grande quantità di fenomeni meccanici, elettromagnetici, di relatività 
che riesce a riassumere. Va osservato tuttavia come quest’ultimo principio 
fu inteso, dallo stesso Hamilton, cosi come è inteso ancor oggi, con un ruolo 
assai più modesto di quanto non pensasse Maupertuis. Non si tratta di cogliere 
una legge universale della natura, ma semplicemente un punto di vista unitario 
per descriverne i fenomeni. Questo fatto è spiegabile osservando come, quando 
Hamilton elabora le sue teorie matematiche (intorno al 1830), sia ormai soprav- 
venuto un completo mutamento negli ideali e nelle prospettive scientifiche 
rispetto al secolo xviti. L'indagine intorno ai fenomeni naturali ha acquistato 
una molto maggiore problematicità. 

Si è già avuto occasione di osservare come le forme differenziali si presentino 
in matematica in epoca abbastanza recente, precisamente verso la fine del se- 
colo scorso. 

Il maggiore contributo, se non addirittura l’«invenzione » della loro teoria, 
proviene da Elie Cartan, il quale ebbe occasione di considerarle in connessione 
al «problema di Pfaff». Sarà quindi opportuno illustrare brevemente questo 
problema. Sia una «forma differenziale» 


w=X,dx,+X3dx,+...+X,d%, 


in cui X,, ..., X, sono funzioni delle variabili x,, ..., x; e si consideri l’equa- 
zione 
w= X,dx,+Xodx,+...+X,dx,=0. 


Può succedere che la forma differenziale w sia esattamente il differenziale di 
una funzione f(x, xp, ..., x,), avendosi in tal caso X,=df/dx,, ..., X,=0df/dx, 
oppure, più in generale, può essere J/w=df. In questo caso la più generale 
«soluzione» dell’equazione w=0 è data da f(x, ..., x,)=cost. Però può ac- 
cadere che w non sia pensabile in questo modo, ossia che non esista alcuna M 
tale che Mw=df. Che senso bisogna dare allora ad un’equazione del tipo 


A1dx,+X,dx,+...+X,dx,=0) 


Verso la fine del Settecento Eulero, nelle Institutiones calculi integralis, con- 
siderando la particolare equazione 


| Pdx+Q0dy+Rdz=o 


conclude senz’altro che quest’equazione è priva di senso se non vi è un mol- 
tiplicatore M in modo che M(Pdx+0dy+Rdz) sia un differenziale. Afferma 
perentoriamente: «Se non esistesse un tale moltiplicatore l’equazione differen- 
ziale proposta sarebbe assurda» [1768, III, p. 9]. 

Il punto di vista di Eulero è perfettamente corretto; se però s'intende come 
soluzione, nel caso ad esempio delle tre variabili, una superficie, cioè una so- 
luzione data da un'unica equazione. Tra la fine del Settecento e l’inizio del- 
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l’Ottocento s’imporrà tuttavia la necessità d’intendere le soluzioni in maniera 
più generale. Ad esempio, nel caso dell'equazione considerata da Eulero, si 
potrebbero cercare soluzioni di dimensione minore, ad esempio delle curve. 
Cosi l'equazione dy—zdx=0, che non ha soluzioni nel senso di Eulero, ha 
come soluzioni nel nuovo senso le curve date dalle due equazioni y= fi (x) e 
z=f'(x) con f funzione arbitraria. Si hanno dunque come soluzioni infinite 
curve, ottenute al variare di f; la soluzione in senso classico appare ora come 
corrispondente al particolare fenomeno per il quale queste curve dovrebbero 
descrivere una superficie. ; 

Verso l’inizio dell'Ottocento Pfaff pose in forma chiara questo punto di 
vista. Data l’equazione 


Xda, +Xydxot... +X,,dx,=0 


si tratta di verificare non se essa ha soluzioni del tipo f(x, xa, ..., *,) = COSt, 
ma piuttosto di cercare le soluzioni di dimensione massima. Pfaff ebbe modo di 
mostrare come un’equazione in 22 0 21—1 variabili ha sempre come soluzione 
un sistema di equazioni (varietà integrali) in numero non più grande di n. 
Nel caso delle tre variabili si hanno soluzioni rappresentate da al più due 
equazioni, cioè almeno delle curve. Il problema fu affrontato successivamente 
da molti dei migliori matematici i quali diedero importanti contributi soprattutto 
per quanto riguarda la esprimibilità delle soluzioni. [Per la storia del problema 
di Pfaff durante l’Ottocento si può consultare ad esempio Forsyth 1890. Per 
una trattazione in un certo senso conclusiva cfr. Goursat 1922]. i 

Come si è visto sopra, l’introduzione delle forme differenziali è dovuta 
ad Elie Cartan, il quale scrive nell’articolo Sur certaines expressions différentielles 
et le problòme de Pfaff: «Il presente lavoro costituisce una esposizione del pro- 
blema di Pfaff fondata sulla considerazione di certe espressioni differenziali 
simboliche, intere ed omogenee in rapporto ai differenziali di x variabili, con 
i coefficienti funzioni qualsiasi di queste variabili. Queste espressioni posso- 
no essere sottoposte alle regole ordinarie del calcolo a condizione di non scam- 
biare l’ordine dei differenziali in un prodotto. Il calcolo di queste quantità è, 
insomma, quello delle espressioni differenziali che sono poste sotto un segno di 
integrale multiplo. Questo calcolo presenta numerose analogie con il calcolo 
di Grassmann; è dunque identico al calcolo geometrico di cui si serve Burali- 
Forti in un libro recente... 3 . 

«Nel caso di una espressione di primo grado di Pfaff, si può associarle 
un’altra espressione differenziale di secondo grado, che è un covariante in 
rapporto ai cambiamenti di variabile e che non è altro che il covariante bilineare 
di Frobenius e di Darboux. Io la chiamo la derivata della espressione di Pfaff. 
Ma grazie alla nozione delle espressioni differenziali simboliche, questo cova- 
riante è il primo termine di una successione di covarianti simbolici di terzo, 
quarto, ... grado che si deducono dalla espressione di Pfaff e dalla sua derivata 
con delle moltiplicazioni; esse costituiscono la derivata seconda, terza, ... della 
espressione di Pfaff, la derivata p-esima essendo di grado p+1» [1899, ed. 
Gauthier-Villars p. 305]. 
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Come si vede, Cartan introduce accanto alle forme differenziali anche l’ope- 
razione di derivata; oggi si preferisce chiamarla «differenziale esterno». Nel 
seguito, quando si tratterà delle forme differenziali ($ 4) verranno impiegate 
la terminologia e la notazione moderne. 

Concludendo, va ribadita la necessità di considerare il calcolo differenziale 
di cui si è delineato qualche aspetto, come un oggetto unitario inseparabile 
dalla sua evoluzione, la quale sola, permettendo di cogliere le linee di sviluppo, 
può guidare le ulteriori ricerche. 


I. Equazioni differenziali. 


1.1. Esempi, definizioni. 


Un primo esempio fondamentale è dato dalla dinamica del punto materiale. 
Questo esempio è implicito nei Principia di Newton, nel quale libro l’autore 
preferi non servirsi del calcolo differenziale, giudicandolo non sufficientemente 
rigoroso. Se x, y, z indicano le coordinate di un punto P di massa wm il quale 
è sottoposto ad una forza f di componenti f,, fo, f € se s’immagina ulterior- 
mente che il sistema sia variabile in funzione del tempo #, si hanno le equazioni 

d°x d° d°3z 
euri Temi Time. 


Se, come in molti casi, s'immagina che la forza f abbia componenti che dipendo- 


no dalla posizione del punto, dalla velocità e dal tempo, le equazioni possono esser 
poste nella forma: 


dîx ; dx dy dz 
mora ,%,) Sa di di 

d*y dx dy dg 
mE So(1 XV, 3) di’ di %) 

d°z dx dy dz 
n -so(1 x, Y, 3, di di’ 7) 


e si ottiene ciò che si dice un sistema di equazioni differenziali del secondo 
ordine. 

Un altro esempio, tra i primi presentatisi nella storia del calcolo differen- 
ziale, è dato dalla isocrona. Si tratta di trovare una curva lungo la quale un 
pendolo impieghi lo stesso tempo nel fare una oscillazione completa tanto 
scivolando lungo un arco lungo quanto scivolando lungo un arco breve. 

Giacomo Bernoulli nel 1690 ottenne l’equazione differenziale della curva 


nella forma: 
Vb?y — aè dy= Va3 dx 
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Dall’uguaglianza dei due differenziali, Bernoulli concluse che gli «integrali» 
(termine usato per la prima volta) dovevano essere uguali e cosf ne concluse 


la soluzione: 
(2b*y — 2a8)V by — a = 36°V adx. 


Si tratta, come è noto, di una cicloide. n 

Un altro esempio, dovuto ancora a Giacomo Bernoulli, è quello della 
brachistocrona. Dati nel piano due punti P e O (fig. 1), si tratta d’individuare 
la linea che deve percorrere un corpo pesante per scendere da P aQ nel minor 
tempo possibile. Se si assume il riferimento come nella figura indicata si trova 
facilmente che il tempo necessario per percorrere il tratto PQ è dato da 


VA 12 
f Vela. 
0 289 
Si tratta perciò di determinare una funzione y (x) in modo che questo in- 


tegrale abbia valore minimo. Come si vedrà trattando del calcolo delle varia- 
zioni, questa condizione dà luogo all’equazione differenziale 


i I a 
ha Vy(1+y"?) 


ossia 
I 


Vy(1+y'2) 


da cui si ottiene ancora come soluzione una cicloide (cfr. oltre, $ 3.1). Il fatto 
che i due problemi diano luogo alla stessa soluzione fu naturalmente accolto 
con molto stupore e fu oggetto di vivaci scambi di corrispondenza, secondo 
l’uso dell’epoca. 3 cit ) 
Ecco ora un esempio assai più moderno, illustrato con maggiori dettagli 
poiché è assai semplice ed al tempo stesso si presta bene ad una discussione 
metodologica. ag 
Si consideri una popolazione di organismi di una certa specie, la quale sia 


x P 


Q 


Figura 1. 


Problema della brachistocrona: un corpo pesante deve percorrere la linea PO nel più 
breve tempo possibile. 
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costituita al tempo iniziale, t=0, da n membri, e si indichi con y(t) il numero 
degli individui al tempo #. Ovviamente y(?) è un numero intero, tuttavia si 
farà l’ipotesi che y(t) sia una funzione continua e differenziabile di #. Si sup- 
ponga inoltre che la rapidità di cambiamento della popolazione al tempo È 
dipenda solamente dallo stato della popolazione al tempo # e non da quanto 
accade prima. Esattamente, si supponga che in un intervallo di lunghezza 4 
vi sia la probabilità f che ogni individuo faccia nascere un nuovo individuo. 
Da queste ipotesi si ottiene: 


(+4) -y(t)=p-h-y(t) 
e allora 


Ali = 240) 


Da questa equazione, facendo tendere % a zero, si ha l'equazione differenziale 
y'=p-y(t). Si osserva ora molto facilmente che 


20 a log(y() 
e perciò 
4 log(y@)=p 
dt 
cioè 


log(y(1))=pt+C 
p(t)= ero. 


La costante C che compare nella formula trovata può essere ricavata osser- 
vando che per #=o deve essere y(0)=%x e perciò y(o)=e©=n. Si ha quindi: 


y(t)=n-e!. 


Questa è quindi la soluzione del problema che ci siamo posti. La soluzione 
ci dice che la popolazione cresce esponenzialmente al crescere di #. Si osservi 
però come questo risultato non è affatto legato alla natura del problema che 
ci siamo posti, è semplicemente il frutto di drastiche semplificazioni. Con di- 
verse ipotesi si potrebbero ottenere equazioni differenziali ben differenti, in- 
terpretabili in maniera opposta! Se supponiamo, ad esempio, che i mezzi di 
sussistenza diminuiscano al crescere della popolazione, possiamo assumere l’i- 
potesi 


VA) =d9(0)-9:9*(1) 


introducendo il fattore «malthusiano» —g-y?(t). Cosa significa l’introduzione 
di questo fattore? Fin tanto che y(t) si mantiene «piccola» la quantità y?(#) 
può essere trascurata, e sostanzialmente il fenomeno è governato da una equa- 
zione simile a quella che abbiamo considerata in precedenza. La cosa divie- 


25 
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ne sostanzialmente diversa quando non è più possibile trascurare la Liga 
y?(t); allora il fattore —q-y?(t) altera il comportamento in modo essenzia - 
Questa equazione fornisce un esempio tipico di come un da possa 

dapprima essere descritto in modo lineare, successivamente «perturi ato» SI 
divenire un tipico fenomeno non-lineare. In questo caso, l’equazione, valida 
in prima approssimazione, 

y(t)=p-9(0) 
corrisponde alla descrizione lineare. L'equazione 

y'(1)=p-y(0) 9-9?) 
considerata per y (1) sufficientemente piccolo corrisponde alla descrizione per: 
turbata. Infine la stessa equazione considerata per y(t) qualsiasi “pe Di 
al fenomeno non-lineare. La figura 2 dovrebbe essere esplicativa di quanto 


esposto. Volendo esplicitare dal punto di vista matematico il a a: 
e calcolando, sempre assumendo come valore iniziale y(0)=n, la soluzione, 
’ 


np 
DO = Tg ta 


si trova questa volta 


Questa soluzione, per g=0, si riduce a quella precedente. Se go il comporta- 
mento della soluzione è notevolmente diverso. Si ha per esempio 
; d 
lim y(t)=—. 
t>+-to0 q 
e indefinitamente, tende a stabilizzarsi intorno 
. 5 spe - I 
al valore p/q. La trattazione non-lineare è dunque sensibilmente diversa! sa 
L'esempio presentato si presta bene ad un'ulteriore osservazione. Dal 


l'equazione differenziale y'(t)= p-y(t) si è ricavata la soluzione generale 


La popolazione, invece di crescer 


Teoria lineare 


Teoria non-lineare 


Perturbazione 


Figura 2. i 
L'opposizione lineare/non-lineare e la perturbazione, 
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y(1)=eP!+€, cioè una famiglia di funzioni. Solo successivamente si è deter- 
minata una soluzione particolare imponendo una condizione iniziale: y(0)=w. 
Questo fatto è del tutto generale: la soluzione di un'equazione differenziale è 
data da una famiglia di funzioni. Con maggiore precisione si può dire che 
questa famiglia dipenderà da tanti parametri quanto è l'ordine della più alta 
derivata che compare nell’equazione differenziale. Prima di dare a queste os- 
servazioni una forma più precisa e rigorosa mostriamo con un ultimo esempio 
come, viceversa, da una famiglia di funzioni dipendente da un parametro si 
determini un’equazione differenziale. 

Si consideri la famiglia delle circonferenze con centro nell’origine di un 
sistema di ‘riferimento cartesiano x°2+y?=2. Se in questa equazione si pensa 
la y come funzione della variabile x e si deriva rispetto ad x, si ha 2x+2yy'=0 
e quindi si ottiene l'equazione differenziale y'= —(x/9). 

Prima di procedere è ora necessario dare un certo numero di definizioni 
e fissare una certa terminologia. 


DEFINIZIONE. Un’equazione differenziale del primo ordine è una relazione del- 
la forma f(x, y, y')=0, ove f è una funzione definita in un certo insieme Q CR. 


Per soluzione di quest’equazione differenziale s'intende una funzione y(x) 
tale che si abbia identicamente f(x, y (x), y/(x))=0. 

In modo analogo si definisce un'equazione differenziale di ordine n come 
una relazione della forma f(x, y, y', ..., y‘)=0 ove questa volta la funzione 
f è definita su un sottoinsieme di R*#!, 

Per soluzione generale (o integrale generale) dell'equazione differenziale 
di ordine n s'intende una funzione y=(x, c,, c2, ..., Cn) dipendente da n para- 
metri indipendenti, tale che y soddisfi identicamente l'equazione differenzia- 
le. Ad esempio: se si considera l’equazione differenziale del secondo ordine 
y'"=o0, questa ha per soluzione generale y=c,g+<cy. Una soluzione che si 
ottenga dalla soluzione generale assumendo certi valori C1, 3, +.., €, Viene detta 
integrale particolare. 

Nell'esempio molto semplice considerato, y'=0, la soluzione generale 
descrive tutte le soluzioni. Questo però, in generale, non accade. Vi possono 
essere delle soluzioni dell'equazione differenziale che non sono ottenibili nella 
forma di integrali particolari. Questo può succedere, per esempio, per valori 
limite dei parametri che compaiono nella soluzione generale. Si consideri ad 
esempio la famiglia di parabole x*+Xy=o0. A questa famiglia appartiene anche 
(per X- co) la retta y=o. In effetti, se si elimina il parametro 4 si ottiene 
l'equazione differenziale xy'+2y=o0, la quale ha anche la soluzione y=0. Que- 
sta soluzione non è un’integrale particolare. 


1.2. Equazioni differenziali elementari. 


In questo paragrafo vengono considerati alcuni esempi di equazioni dif- 
ferenziali, tra i più semplici e tra i primi presentatisi storicamente. 
Equazione a variabili separabili: quando l'equazione differenziale ha la 
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forma f(x)+g(y)y/=0, il problema della ricerca della soluzione generale si 
risolve immediatamente nella forma 


fi (#1) dt+ f £(t)dt= cost. 


Xo Yo 


Equazione differenziale lineare: è un'equazione della forma y'+f(x)y+ 
+g(x)=o. Se si effettua la sostituzione y = f9, si ha y'=p'q+9'P; sostituendo 
nell'equazione differenziale si ottiene 


(p'a+a'p)+f)pa+g(x)=0. 
Riorganizzata l’espressione nella forma 
Pla +f®)d)+p'4+8()=0, 


è ora possibile scegliere la funzione q in modo che g'+f(x)g=0, ed a tal fine 

basta osservare che g//q è la derivata di log |g|. Determinata cosi la funzione q 

e tornando all’equazione differenziale, si ottiene semplicemente p'9+g(x)=0, 

che si risolve immediatamente. Note le due funzioni p e g è data la y da pq. 
Equazione di Riccati; è un’equazione della forma 


V+f(A)9*+g(2)y+h(x)=o0. 


Questa equazione è molto importante per due motivi. Essa è stata ottenuta 
da Jacopo Riccati effettuando un cambiamento di variabili, a partire da una 
equazione del secondo ordine: è dunque uno dei primi esempi di tentativi di 
risolvere un’equazione differenziale riducendone l’ordine con un cambiamento 
di variabili. In secondo luogo l’equazione di Riccati mon può, in generale, 
essere risolta mediante integrazione. Negli esempi considerati in precedenza, 
l'equazione differenziale, dopo un certo numero di manipolazioni, era ricon- 
dotta ad una forma tale che la ricerca delle soluzioni comportava semplicemente 
una o più integrazioni. Si poteva quindi immaginare che questo fatto fosse 
del tutto generale; che una scelta opportuna della sostituzione da effettuare 
riducesse l'equazione ad una risolubile elementarmente, cioè mediante inte- 
grazioni. Ora questo fatto si dimostra impossibile: l'equazione di Riccati non 
può essere risolta mediante integrazione. Va notato, tuttavia, che se si conosce 
una soluzione particolare ), si può trovare la soluzione generale. Infatti con il 
cambiamento di variabili y=+ l'equazione si riduce ad una di Bernoulli. 

Non sembra necessario aggiungere ulteriori esempi di equazioni differen- 
ziali integrabili elementarmente perché, chiara ormai la problematica, il lettore 
interessato può fare riferimento a testi specializzati [cfr. per esempio Coddington 
e Levinson 1955]. Per lo stesso motivo non si tratterà neppure delle equazioni 
differenziali lineari in generale. 


La prima equazione, riscritta con variabili x ed y è x 
ed è nota come equazione di Bessel. 
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1.3. Teoremi di esistenza. 


C > x LEPRI s. o s di ca [a bi 1 
ome si è accennato all INIZIO, le PI me equazioni ifferenziali considerate 
erano direttamente collegate a problemi fisici, ed era quindi chiaro come, se 
queste equazioni riflettevano orrett a 1Ca, non V dovessero 
COrri amente la re. Ità fis 
’ 1 
essere dubbi sull esistenza di soluzioni. In molti casi semplici, poi, queste So- 
luzioni erano calcolabili direttamente mediante quadrature 
Il problema della «esistenza ) della soluzione di una equazione differ enziale 
SI pone Verso la fine el Settecento ed 1 primi q 
d p anni dell Ottocento uando la 
q iderate 1 p esa e com- 
classe di equazioni differenziali cons. d div ene molto 1 estes 
p Cc qui ZIONI di un ti h n p essere immediatamente ricon- 
rende an. he e Q: po che non può ess 
dotto ad un problema fisico, ma che pare perfettamente analogo a quello di 
q ff n ial c. 
equazioni di erenz; 1 he Invece sono ottenute a artire 
p IUr da problemi fisici. 
Il tentativo di risolvere equazioni alle deriv ate par ziali mediante Sostituzioni 
8 S q 
di variabi li dà luo o a numerose equazioni differenzia (0) p 
li non incontrate in pre 
cedenza. Ad esempio, Se SI considera l'equazione delle onde (cfr. oltre $ 2) 
, 


d°u du d°u 1 dî 


dx? dpi aan c? dt? 


la ricerca di soluzioni della forma 


u=u(7, 9, 2,t)=R()0(9)Z(A)T0 


conduce al sistema di equazioni differenziali: 


d°R _1dR m 
d°0 

PT ali 
d°Z È 
Pali A 

d? 
Prosa 
n°=pa—q?. 


My +ay'+(x°-n2)y =0, 


In modo an i otti 4 i i i 
alogo si ottiene l’equazione differenziale di Legendre, a partire 


dall’equazione di Laplace, cioè l'equazione 


(1-x°)y" —2ay'+n(n+1)y=o. 
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Entrambe queste equazioni appartengono al tipo più generale 
a(x)y"+b(a)y'+c(x)y=0. 


Se per le equazioni di Bessel e di Legendre l’esistenza di soluzioni può essere 
chiara per motivi fisici, non vi è ragione di supporre la stessa cosa per questa 
ultima equazione. Nasce cosi la problematica dei « teoremi di esistenza». 

Questa problematica, naturalmente, non si pose all improvviso con chia- 
rezza. Il patrimonio di equazioni differenziali non fu arricchito di colpo in- 
troducendo uno studio sistematico delle equazioni differenziali. Dapprima ci si 
limitò a studiare gli esempi che si ritenevano significativi. Per questi, anche 
se non era possibile fornire le soluzioni in forma chiusa, cioè mediante funzioni 
elementari, era tuttavia possibile indagare la natura delle soluzioni mediante 
uno studio diretto dell’equazione differenziale. In tal modo era implicitamente 
superato il problema dell’«esistenza» delle soluzioni, le quali venivano descrit- 
te con grande accuratezza! Nacquero cosi le «funzioni speciali», come le fun- 
zioni di Bessel; i polinomi di Legendre, ecc. . 2. i 

Si mostrerà ora, con un esempio molto semplice, come sia possibile descri- 
vere le proprietà delle soluzioni direttamente dall'equazione differenziale. Si 
consideri l’equazione differenziale del secondo ordine y'+y=0. Questa, co- 
me si verifica immediatamente, ha le due soluzioni indipendenti sinx, cosx. 
S'immagini tuttavia di non conoscere queste soluzioni e di volerle dedurre 
direttamente dall’equazione differenziale. Posti y/=y, € y=%, l'equazione è 
allora equivalente al sistema , 

n SER 
Vi =Ia 


Da questo sistema si ricava immediatamente la proprietà fondamentale delle 
soluzioni. Si ha infatti: 
U 
2V191+2V292 "0 


e quindi: 
£ 0t+)=0 
dx 1 2 


cioè i 
È +93 = cost. 


Se ora si assumono le condizioni iniziali y; (0)=0 e yy (0)= 1, si ha esattamente 
dp 
Vi +y 271; 


che è la proprietà fondamentale delle due funzioni y=sina, GE C0S 

È chiaro come in tal modo non si è «dimostrata» l’esistenza di soluzioni 
dell'equazione differenziale, ma è anche chiaro come quanto sì è osservato 
circa le eventuali soluzioni l’abbia resa completamente plausibile, al punto 


tale da far diventare il problema intorno alla loro esistenza di natura pedan- 


763 Differenziale 


tesca. Cosi, se è data una singola equazione differenziale, operando in questo 
modo, si può, in un certo senso, aggirare l’ostacolo di un teorema di esistenza. 
Ma il problema diviene di natura completamente diversa quando il patrimonio 
di equazioni differenziali si arricchisce al punto tale da considerare equazioni 
differenziali con un grande grado di arbitrarietà. In questo momento la pro- 
blematica dei teoremi di esistenza si pone con tutto il suo vigore. 

Questo è un buon esempio di come un incremento quantitativo all’interno 
di una teoria dia luogo ad un incremento qualitativo. 

Va notato ancora come, nello stesso periodo e per ragioni sostanzialmente 
analoghe, si pone la problematica dei teoremi di esistenza anche all’interno 
dell’algebra. Infatti i teoremi per l’esistenza di radici di un’equazione algebrica 
della forma 


A +An 30" 1+...+4X+09=0 


si collocano tra la fine del Settecento ed i primi anni dell’Ottocento. 

Si presentano ora tre possibili dimostrazioni del teorema di esistenza: un 
primo metodo di Cauchy, noto anche come metodo dei poligoni; un secondo 
metodo, pure dovuto sostanzialmente a Cauchy, basato sugli sviluppi in serie; 
e infine il metodo di Peano-Picard. 

Si tratteranno in maniera schematica i primi due metodi, mentre si entrerà 
in maggiori dettagli per quello di Peano-Picard, che si è certamente affermato 
come il più importante ed è quello sviluppato nella maggior parte dei testi 
moderni sulle equazioni differenziali. 

Un primo teorema di esistenza fu dato da Cauchy nei suoi Exercices.d’analyse 
per l’equazione differenziale del primo ordine y'=f(x,y). Questo metodo, 
molto legato alla evidenza geometrica, utilizza sostanzialmente la stessa idea 
che è contenuta nella definizione dell’integrale come limite di somme. Si sup- 
ponga di voler calcolare la soluzione dell’equazione differenziale nell’inter- 
vallo (xo, x0+8) (ove è è definito opportunamente a partire dall’equazione 
differenziale. Si veda, per esempio come è calcolato quando viene illustrato 
il metodo di Peano-Picard), supponendo che la soluzione cercata (x) assuma 
in xy il valore yo. Se nell’equazione differenziale si pongono i valori xo, Vo 
al posto di x ed y si ha un valore numerico f(xo, Yo) che è l’inclinazione della 
retta tangente nel punto (xo, yo). Si consideri ora una suddivisione dell’inter- 
vallo (xo, xo +3) mediante certi punti x, =@d9<4,<49<...<@,=%g+ò. In cor- 
rispondenza ai valori 4, è possibile calcolare per ricorrenza Vina=Vt+f(0;,V3); 
ove, naturalmente, y9=(xo). Si passi ora a considerare la poligonale di verti- 
ci P,=(a,, y;) (cfr. fig. 3) e sia y(x) l'equazione che definisce questa poligo- 
nale. Si dimostra che se si fa tendere a o la massima distanza dj41—@; questa 
poligonale definisce una soluzione dell'equazione differenziale. Le ipotesi che 
Cauchy poneva per fare questa dimostrazione erano la continuità della f(x, 9) 
e della f, (x,y). In seguito fu dimostrato da Lipschitz come queste ipotesi 
fossero eccessive. Egli pose in evidenza l’essenzialità della condizione, chiamata 
oggi con il suo nome — condizione di Lipschitz — che verrà illustrata qui di 
seguito. 
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; : M 
e il suo sviluppo: F(x, v)=) —a(®-x0o)*(v—y0)f. Si consideri ora la serie- 
soluzione dell’equazione Pata 


IT dY 

I I 

T=F@Y) 
| 

Ì 

I 


| 
I I 
I I 
strati 1 1 
i di cui è agevole mostrare la convergenza utilizzando il fatto che F(x, Y) è 
dee ——ede data in modo esplicito. Si dimostra come questa serie domini termine a termine 
d 4 an=% +3 la serie 


It 


Figura 3. y 
Metodo dei poligoni per determinare la soluzione di una equazione differenziale. Votyvo(®—xo)+ S (e-x0)?+.. 


13 . . nei . î da cui si conclude la conver ichi 
DEFINIZIONE. Sia f(x, y) definita nel dominio del piano x, y dato dalle disegua- E ora. il metodo di iene sai Picard. P t 1 
Aaa 4 oa ea sO, eano-Ficard. Per poter trattar 
I glianze |x —x<@ € |y-yol <b. Si dirà che in tale dominio f(x, y) è lipschitziana diiosttazione in midaieti più dettagliata, occorre un enunci È i ba di 
il rispetto a y se esiste una costante A tale che n TATA 


| dr sal ga Data l’equazione differenziale y' =f(x, y) con la condizione iniziale 
9 (x0)=%Vo, supponiamo che per x, <xX<%xot4, Vo-b<y<Vo+b, la funzione 
f(x, y) sia continua e verifichi la condizione di Lipschitz | f(x, y)— f(x, Ya) < 
nità, rispetto alla variabile y. L’essenzialità di questa condizione viene bene in <A|y\—yal. Allora esiste un numero è ($<a, che si determina nel corso della 
I} luce dimostrando il teorema di esistenza, ad esempio con il metodo di Peano- dimostrazione) în modo che in (x0, x0-+) il sistema ha una ed una sola soluzione 
il Picard. > (x) che verifica la condizione iniziale y(x) = 
i La seconda forma del teorema di esistenza di Cauchy è data supponendo 
la f(x, y) analitica nell'intorno di un certo punto (xo, Vo). Naturalmente in 


Le ipotesi del teorema possono essere ridotte alla continuità ed alla lipschitzia- 


Gli elementi essenziali della dimostrazione sono i seguenti: 


quest’ipotesi si cerca una soluzione analitica. La dimostrazione è ancora molto I) si sostituisce all’equazione differenziale l'equazione integrale equiva- 
î| naturale. Se l'equazione ammette una soluzione, questa è della forma lente 

fi vo Vv! x 

il 9 (A) =Po+96 (ero) tp ttt v()=s+ | F(t,9 (1) dt; 

li A i ° 3 Zo 

I dove y5', yi/', .. sono determinati dall’equazione differenziale. Si tratterà II) si considera la formula ricorrente 


quindi di mostrare come questa serie definisca effettivamente una funzione, 
ossia che sia una serie convergente. Si osservi come il metodo di considerare Vo(®)=Va È 
‘ Ja serie scritta sopra come una soluzione dell’equazione differenziale sia pre- 

il; sente fin dalle n del calcolo differenziale, pa metodo di calcolo della Int #)=y | Ft In (0) dt; 
ih soluzione. La grande differenza dell’atteggiamento di Cauchy, dovuto alla + 
esperienza delle serie divergenti, è che ora egli avverte con chiarezza che il 
| punto essenziale è quello di mostrare la convergenza della serie. 

La linea della dimostrazione è la seguente. Poiché f(x, y) è analitica nel 
ll punto (xo, yo), vi sono due cerchi di raggi r, ed 7, in modo che, se x ed y veri- Ò 

Li ficano le diseguaglianze [x-x]<%, € |y-yo|<72; allora f(x, y) è analitica. Im (®) =Vo+ i Î(0,Im(t)) dt 
In particolare essa è superiormente limitata da una costante MM. Ora, si con- n 

siderino la funzione 


ni) si dimostra che y,,(x) converge ad una funzione Y (x); 
Iv) in corrispondenza fx, f(t,y,(t)) converge a fx, f(t, Y(0) dt; 
v) allora dall’equazione 


facendo tendere 1 a co, si ottiene l’equazione 


Ta 


si 2 Ir) V@=rnt [10 Y(t)) dt. 
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Si tratterà poi di dimostrare l'unicità della soluzione trovata, il che si com- 
pie in maniera abbastanza agevole. 

La dimostrazione che è stata accennata del teorema di esistenza ed unicità 
utilizza un metodo dimostrativo che va molto al di là dell’applicazione specifica 
fatta: il principio del punto fisso. Nella forma che viene utilizzata per la dimo- 
strazione di questo teorema, esso è dovuto a Banach (1922), mentre l’idea della 
sua applicazione alle equazioni differenziali per dimostrare teoremi di esistenza 
è dovuta a Birkhoff e Kellog [1922]. Si vuol qui rianalizzare la dimostrazione 
alla luce di questo principio, perché esso costituisce una tecnica dimostrativa 
fondamentale. Si vedrà in seguito come anche altri teoremi, ad esempio quello 
di Bendixon sui sistemi autonomi, possano ricondursi ad applicazioni del prin- 
cipio del punto fisso. 

Sia X uno spazio metrico completo ove d indica la distanza, e sia Q un 
chiuso di X. Sia poi T : Q+Q una trasformazione di (2 in sé. Un punto x, 
che sia soluzione dell'equazione T(x)=x viene detto un punto fisso. Si ha ora 
il seguente: 


TEOREMA. Sia T una contrazione, cioè una applicazione che soddisfa 
d(T(x), T(y))<ad(x, y) con a<1 (indipendente da x ed y). Allora esiste un uni- 
co & per il quale T(£)=&. 


Dimostrazione: Sia xy un punto arbitrario di Q; si ponga X,41= T(&n). 
Allora, essendo anche x,=T(x,_1) si ha 


d(%n413 Xn) ZAd(xn, Xn-1) 


e quindi 
d(Xn419 Xn) <a" d(x1, xo). 


Di qui è facile dedurre che {x,} è una successione fondamentale. Essendo X 
completo esiste un # tale che x,->#. Si vede poi immediatamente che 7'(£)= &. 
L’unicità della soluzione segue dal fatto che, ammesso per assurdo che vi sia 
un’altra soluzione x’, deve allora essere 


d(&, x°)=d(T(£), T(x))<ad(£, x) 


il che è assurdo, poiché a<1. 
Si può applicare ora questo teorema al caso che interessa nel modo se- 
guente. Posto 


TY) = I fa), 


al posto di X si consideri lo spazio delle funzioni continue definite in [xy, xt 4] 
con la norma 


p@i= ma 196) 


LE[Zo, Cota 
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È ora possibile dimostrare che 7 risulta essere una contrazione e di qui segue 
l’esistenza e l’unicità della soluzione. 

Come conclusione di questo paragrafo, qualche osservazione. 

1) Il metodo esposto, che permette di ricavare una soluzione in un intorno 
destro di x), si estende in modo ovvio ad un intorno sinistro di x. Si può 
quindi immaginare la soluzione definita per (x0—€, x0+£). 

2) I metodi or ora illustrati per l'equazione differenziale del primo ordine si 
estendono senza difficoltà a sistemi di equazioni differenziali del primo ordine, 
e quindi ad un sistema di equazioni differenziali di ordine qualsiasi, poiché 
vi è equivalenza fra un’equazione differenziale di ordine superiore al primo e 
un sistema di equazioni differenziali del primo ordine. Infatti data l'equazione 


pia =f(x, LA v, y"”, DE) pin) 
basta porre y=y,, y/=%2, 9-0 =y,, e si ha il sistema 


vi =2 


Vh1 =Yn 
Vn=f(%,V1 In) 


3) I teoremi di esistenza visti sopra, in particolare quello di Peano-Picard, 
garantiscono l’esistenza di una soluzione localmente. In altre parole la soluzione 
è determinata in un intorno del punto xy: (xo— 3, x0+3). Naturalmente se nel 
punto x9+$ non cadono le ipotesi del teorema di esistenza, la soluzione può 
essere prolungata a x7+3+d, e cosî via. Tuttavia, anche se le ipotesi del teo- 
rema di esistenza continuano a valere, può succedere che la successione 
xo+d, x0+9+8,, x0+9+d,+8%, ... abbia limite finito, cioè che la soluzione 
non sia ulteriormente prolungabile. Si ha infatti l'esempio ben noto (cfr. 
Tricomi [1961]) dell'equazione differenziale che definisce le iperboli del tipo 


Se si considera l’integrale passante per il punto (xo, Yo), Ossia 


I 
n. 
xX-Xot_ 
Vo 


questo non è prolungabile oltre il punto xp — (1/y,). Tuttavia l'equazione dif- 
ferenziale che corrisponde a questa famiglia di iperboli è y/+y?=0 che non 
presenta in questo punto alcuna singolarità. 

4) La soluzione di un’equazione differenziale ordinaria dipende con con- 
tinuità dai dati. Si ha in effetti il teorema seguente: 
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TEOREMA. Sia y'=f(x, y) un'equazione differenziale che ha per soluzione în 
(xd, x0+9) una curva y(x) tale che y(xo)=Y Se F(x) è una soluzione 
3(x)=vot0, allora per |x-x]<ò si ha 


17(®)-y(#)] <0-e49, 


ove la costante A è quella che corrisponde alla condizione di Lipschitz per la fun- 


zione f(x, y). 


1.4. Teoria di Sturm e Liouville. 


Una tecnica importante per la risoluzione delle equazioni alle derivate 
parziali, come si vedrà ad esempio nel caso dell’equazione delle onde, consiste 
nel metodo della separazione delle variabili. Questo metodo riconduce la risolu- 
zione dell’equazione originaria alla risoluzione di un certo numero di equazioni 
differenziali ordinarie. Poiché in generale i problemi che conducono ad equa- 
zioni alle derivate parziali hanno assegnate condizioni al contorno, si ottengo- 
no analogamente, per le equazioni differenziali ordinarie che si ricavano, delle 
condizioni al contorno. Ad esempio, per un’equazione del secondo ordine 
del tipo y"+P(x)y" +0(x)y=o0 si ricerca una soluzione per la quale sia 
9 (0) =Vo, y(x1)=y,. Una tipica richiesta di questo tipo compare per l’equa- 
zione della corda vibrante, ove le condizioni precedenti significano che s'im- 
maginano fissati due punti della corda. 

In generale la tecnica della separazione delle variabili comporta l’introdu- 
zione di un parametro e le equazioni differenziali che si ottengono hanno 
soluzioni solamente per certi valori particolari del parametro (autovalori). 
Le soluzioni corrispondenti (autofunzioni) possiedono importanti proprietà 
di ortogonalità che verranno analizzate successivamente. Per illustrare e moti- 
vare il tipo di analisi al quale si perviene, verrà utilizzato appunto l’esempio 
importante della corda vibrante. 

L’analisi del suo movimento fu motivata storicamente dalla necessità di 
capire la natura dei suoni musicali. D’Alembert, al quale si deve un metodo 
brillantissimo per la risoluzione dell’equazione della corda vibrante — sostan- 
zialmente il capostipite della tecnica della separazione delle variabili —, era 
in contatto molto stretto con Rameau e con le sue idee. Egli infatti è autore 
degli Eléments de musique théorique et pratique suivant les principes de M. Rameau, 
il che testimonia appunto la sua attenzione ai problemi musicali; ma in generale 
si può dire che l’interesse per questa problematica è condiviso da tutti gli 
enciclopedisti. Basti pensare ai Principes généraux d’acoustique di Diderot, o 
alla Lettre sur la musique frangaise di Rousseau, 

S'immagini, dunque, la corda vibrante come una corda di violino, ad 
esempio quella accordata sul sol. Se essa viene strofinata con un archetto, si 
ode naturalmente la nota sol, ma essa è accompagnata anche da altri suoni, 
di altezza sempre maggiore e di decrescente intensità. Sono udibili distinta- 
mente l’ottava del suono fondamentale, cioè ancora un sol; la dominante, cioè 
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la quinta successiva; il re, la terza; il si, ... e cosf via, Se si assume come defini- 
zione di suono musicale il prodotto di vibrazioni periodiche e regolari, si può 
esprimere matematicamente questo fatto con: «Ogni data forma regolare, 
periodica, di vibrazione (ogni suono) può sempre prodursi come somma di 
vibrazioni semplici, aventi periodi che sono uguale a quello dato, doppio, 
triplo, ... e cosi via». Questo fatto, che ogni suono sia scomponibile come 
somma di altri suoni, spiega la natura, «il timbro» del singolo suono. La 
«purezza», la «semplicità» che associamo al suono del flauto, corrispondono 
alla relativa assenza di suoni concomitanti con quello fondamentale; come si 
dice, all'assenza di «armonici». La diversa qualità sonora del violino va invece 
ascritta alla ricchezza di armonici che accompagnano le sue note. Si vedrà 
più avanti come la teoria di Sturm e Liouville fornisca un supporto matematico 
ai risultati dati in modo qualitativo. 

In questo paragrafo ci si nica ad un’equazione del secondo ordine della 
forma 


(1) y'+P(x)y+0(x)y=o. 


Occorre dunque premettere qualche risultato sulle soluzioni di questa equa- 
zione. 


DEFINIZIONE. Due soluzioni y,(x) ed y» (x) dell'equazione (1) sono dette dipen- 
denti se una di esse è ottenibile dall’altra moltiplicandola per una costante. Sono 
dette indipendenti in caso contrario. 


TEOREMA. Se y, (x) ed y» (x) sono soluzioni indipendenti dell'equazione diffe- 
renziale y''+P(x) y+0(x)y=o nell’intervallo [a, b], allora ogni altra soluzio- 
ne è della forma c, y,(x)+cs Ys (2). 


Dimostrazione: È chiaro come c; y;(x)+cs y»(x) sia una soluzione della 
equazione differenziale. Occorre quindi solamente dimostrare come ogni solu- 
zione sia di questa forma. Sia dunque y(x) una soluzione. Per dimostrare che 
esistono due costanti c, e c, per le quali y(x)=c; y1(x) +c2 y2(x) basta che per 
qualche punto x, di [a, db] si abbia 


61 Y1 (0) +02 Ya (X0) = (X0) 
Ci V1 (Vo) +02 Y2 (0) = (0) 


perché in tal caso y(x) e c1y1(x)+c2y2(x) sono due soluzioni con lo stesso 
valore iniziale e lo stesso valore per la derivata prima. Affinché il sistema sia 
risolubile, occorre allora che 


Va (xo) 2(%0) 
I1 (x) V2(%0) 


sia diverso da zero. Si consideri ora la funzione di x, W(y,, ya) =V1V1—V2%1 
che viene detta il wronskiano di y,, yz (dal nome del matematico polacco 
Wrofski). Poiché 


W'= Y19 +I1VL- VI! — VIVIANE — VI 


=Y1 (40) Y2 (0) —D2 (#0) PI (X0) 
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tenendo conto del fatto che y, e y, sono soluzioni dell’equazione differenziale, 
cioè 

vi +Pyi+Qy,=0 

Va +Pyo+Qy,=0 


moltiplicando la prima equazione per y, e la seconda per y,, si ha 


V201 +Pyov1+0y2y:=0 
Viva +Py1y3+0V192=0 
da cui sottraendo: 


(9192 — Va) +P(9192-Y291)=0 
ossia 


dW(Y,, Va) 


x +PW(y,, 92) =0 


e quindi 
W= ce-5Pds 


e se ne conclude che W(y,, 72) 0 è identicamente zero in [a, d] oppure non si 
annulla mai. Si osserva facilmente che se y, e y, sono soluzioni indipendenti, 
il loro wronskiano non può essere identicamente zero, e si conclude cosf che è 
possibile determinare c, € cy. 

Si torni ora a considerare l’equazione differenziale y"+P(x)y'+0(x)y=o. 
Si è già osservato come questa equazione non sia, in generale, risolvibile in 
termini di funzioni elementari. Tuttavia è stato mostrato, con un esempio, 
quello dell'equazione y/”+y=0, come sia possibile ricavare importanti in- 
formazioni sulle soluzioni direttamente dall’equazione differenziale. L’equa- 
zione y'"+y=o0 è esplicativa anche di un altro fenomeno che si riferisce alle 
soluzioni dell'equazione differenziale generale. Sappiamo che le due soluzioni 
sin x, cosx hanno una disposizione particolare dei loro zeri: precisamente, 
tra due zeri successivi di una funzione cade uno zero dell’altra. Questo risultato 
è di natura generale. Si ha infatti il seguente teorema, detto di separazione: 


TEOREMA (Sturm). Se y, (x) e y3 (x) sono due soluzioni indipendenti dell’equa- 
zione y"+P(x)y+0(x)y=o, allora gli zeri di queste funzioni sono distinti 
e si succedono alternatamente. 


Dimostrazione: Poiché y, e y, sono soluzioni indipendenti, il loro wron- 
skiano non si annulla e, poiché è continuo, avrà segno costante, per esempio 
positivo. È chiaro come y, e yy non possano avere uno zero in comune, altri 
menti, indicato con « questo zero, si avrebbe y, (a) (a) —y2 (a) y1(a)=0. Sia- 


no ora « e f} due zeri di y,; si ha in corrispondenza 


Va (0) Ya (0) ya (2) VI (a) = —y2 (a) 1 (a) #0 
ed anche: 


91 (8) 92(8)-v2 (8) 91 (8) = —p2(8) 71 (B)70. 
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Allora in & sia y, che yj sono diversi da zero; e similmente in f sia yy che y{ 
sono diversi da zero. Inoltre y{ deve avere segni opposti in « ed in f}, poiché, 
se è crescente nel primo caso, deve essere decrescente nel secondo e viceversa. 
Ma allora anche yy deve avere segno opposto in « ed in f. Poiché y, è continua 
deve annullarsi in un punto tra « e f. La funzione y, non può annullarsi più 
di una volta tra a e f}, altrimenti, scambiando i ruoli di y, e di y,, si avrebbe 
che « e { non sarebbero zeri consecutivi. ° 

L’equazione differenziale y+P(x)y'+0(x)y=0, può porsi nella forma 
u'+gq(x)u=o che sarà utile per enunciare un altro importante teorema. Basta 
porre y=w® e sostituire nell'equazione. Si ha allora 


(uv +2uv'+u"v)+P(uv'+uv)+Quv=o0 
e allora 
u"v+(20+Po)u'+(v"+Pv'+0v)u=o. 
Ponendo 20+Pv=o e ricavando una soluzione 
v= e 3SP de, 


l'equazione si riduce alla forma richiesta. 
È ora possibile enunciare il 


TEOREMA. Data l’equazione u''+g(x) u=o0, se g(x)<o ed u(x) è una soluzione 
non banale, allora u(x) ha al più uno zero. 


La dimostrazione di questo teorema si può effettuare con metodi elementari 
come il teorema precedente. Molto importante è anche il seguente 


TEOREMA. Sta y(x) una soluzione non banale dell'equazione y''+gq(x)y=0, 
ove q(x) è una funzione positiva. In un intervallo chiuso [a, 5], y(x) può avere 
solamente un numero finito di zeri. 


Dimostrazione: Si supponga per assurdo che ci siano infiniti zeri in [a, 5]. 
Esiste dunque, per la compattezza di questo intervallo, una successione di 
zeri xn->%g. Poiché y (x) è continua si ha 


y(#o)=1im y(a,)=0 
En+%0 
ed anche 


y (x) =lim V(Xn) => (xo) _ o 
tndto  Xn_%Xo 
Da questo risultato segue che y(x) è la soluzione nulla, contro quanto sup- 


posto. 

Un altro teorema molto importante, sempre dovuto a Sturm, è il cosiddetto 
teorema del confronto. Ancora una volta l’idea direttrice si fonda sulla con- 
siderazione di un fatto elementare. Se si considerano le due equazioni 

y' +y=o0 
x tag =a 
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le soluzioni della seconda equazione y=sin nx, y= cos nx oscillano più rapi- 
damente, se x>I, naturalmente, di quelle della prima. Questo risultato è ancora 
una volta paradigmatico del comportamento dell’equazione generale. 


TEOREMA. Siano date le due equazioni differenziali 


y+g@)y=0 
2"4+r(x)z=0 


ove r(x) e q(x) sono funzioni positive tali che q(x)>r(x). Allora se y(x) e 2(x) 
sono soluzioni non banali delle due equazioni, y(x) si annulla almeno una volta 
tra due zeri successivi di 3(x). 


A conclusione di questo paragrafo, vengono ora enunciati alcuni fra i prin- 
cipali risultati della teoria di Sturm-Liouville per l'equazione contenente il 


parametro ) 
y+P(x)y'+10(x)y=o. 


Questa equazione, moltiplicando per un conveniente fattore, può ricondursi 
alla forma 


Fe] +99 o. 


Moltiplicando infatti per Mf(x) si ottiene 
My''+MPy' +X\MQy=o. 


Supponendo che dM/dx= MP, cioè M=eSPd2 l'equazione si riduce alla forma 
richiesta. Le condizioni al contorno dell'equazione possono ora supporsi del 
tipo: 

y'(a)tay(a)=0 ao, B=o, a<b 

y'(5)+By()=o. 


I risultati fondamentali ottenuti da Sturm e Liouville possono ora rias- 
sumersi in 


1) Il problema ha una soluzione non banale solamente se il parametro 
X ha un valore scelto in una successione A, <Ag <A3< ... <A, che di- 
verge a + co. La soluzione corrispondente a A=, è unica a meno di 
un fattore moltiplicativo. Se come condizioni al contorno invece delle 
(1) si assume y(a)=y(b)=o, allora la soluzione che corrisponde a A, 
ha esattamente n—1 zeri nell’intervallo aperto (a, b). 

II) Se le soluzioni corrispondenti a ), vengono indicate con y,, allora si 
ha la proprietà di ortogonalità 


b 
i 1)I nn dx=0 se m-$xn. 


a 
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Si aggiunga a conclusione del paragrafo che cosi come le funzioni sin x, 
sin 2x, ..., sin nx, cioè le autofunzioni dell’equazione differenziale y"”+)y=0, 
possono essere usate per lo sviluppo in serie di Fourier, allo stesso modo si 
può pensare di sviluppare una funzione f(x) che soddisfi alle condizioni iniziali 
dell'equazione differenziale, mediante le autofunzioni soluzioni dell’equazione 
differenziale, cioè: f(x)= 42, y1(x) +, y2(x)+..-+4,9,(0) +... Se si moltiplica 
per g(x) y, e si integra termine a termine (formalmente), si ha che il coefficiente 
n-esimo è dato da 

i (0 b 
an | IIS de con ann dI 
a 


nua 


Lo sviluppo che abbiamo cosî determinato, detto sviluppo di Sturm-Liouville, 
è valido per classi molto vaste di funzioni, ma un’analisi dettagliata delle con- 
dizioni di validità va al di là dello scopo della nostra esposizione. 


1.5. Equazioni differenziali nel campo complesso. Teoria delle singolarità. 


In tutto il secolo xix si osserva una tendenza generale all'introduzione della 
variabile complessa in vari settori della matematica. 

In geometria, la necessità di una buona sistemazione della teoria dell’inter- 
sezione spinge a considerare punti a coordinate complesse. Anche nel campo 
dell’analisi si evidenziano importanti proprietà difficilmente spiegabili senza 
ricorrere alla variabile complessa. 

In effetti la possibilità di rappresentare una funzione mediante sviluppi 
in serie è legata alla collocazione dei punti singolari, e una funzione «reale» 
può avere punti singolari nel piano complesso. 

Nel campo delle equazioni differenziali vi sono poi molti motivi specifici 
che spingono ad interpretare le variabili come numeri complessi. 

Si osserva intanto che nel vasto patrimonio di equazioni differenziali del 
secolo xIx solamente pochi tipi di equazioni differenziali possono essere risolti 
a partire dalle funzioni elementari con un numero finito di passaggi. Una 
delle tecniche fondamentali, presente fin dall’inizio del calcolo differenziale, 
è quella di ricercare la soluzione mediante serie di funzioni, ed i problemi di 
convergenza si trattano con maggiore facilità nel campo complesso. 

Inoltre, molte importanti equazioni differenziali come quelle di Bessel e 
Legendre e l'equazione ipergeometrica, contengono delle singolarità che sono 
importanti caratteristiche dell’equazione differenziale; ancora, le serie-soluzione 
nell’intorno dei punti singolari si trattano più agevolmente nel campo complesso. 

Due nomi sono soprattutto legati allo sviluppo in questo senso della teoria 
delle equazioni differenziali: Fuchs e Riemann. Nelle pagine seguenti di questo 
paragrafo si accennerà ad alcune delle loro idee e dei loro risultati. 

Va notato, anzitutto, che lo studio si limitò, almeno all’inizio, alle equazioni 
differenziali lineari, cioè della forma 


wM+py (3) w%-1+...+p,(2) w=o0. 
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Questo sostanzialmente per due motivi, perché la maggior parte delle equazioni 
differenziali che interessano, come appunto quelle citate, rientrano in questa 
forma e poi perché l’equazione differenziale lineare ha la caratteristica im- 
portante che i suoi integrali hanno singolarità solamente ove i coefficienti 
presentano singolarità. Come corollario di questo fatto si ha che l'equazione 
differenziale lineare non può avere singolarità variabili. Si è già visto ] ag 
semplicissimo dell’equazione y'+y°=0 la quale tuttavia ha delle soluzioni che 
possiedono delle singolarità variabili. Per le equazioni differenziali lineari si 


ha invece: 


TEOREMA. Se i coefficienti p, (2), pa (2), .... py (£) sono regolari per |z-a|<R, 
allora esiste un'unica soluzione w(z) regolare per |z—a|<R. 


La dimostrazione di questo teorema si ottiene semplicemente Dado 
zando a questo caso la dimostrazione generale del teorema di esistenza e 
unicità visto in precedenza. Va osservato tuttavia il fatto molto importante 
che la soluzione definita per == può essere estesa in un cerchio che ha per 
raggio R la minima distanza dai punti singolari. Ne segue, con il principio 
del prolungamento analitico, ce soluzione può essere estesa in ogni regione 

n contenga punti singolari. 
SE ea appreso di Riemann. Se 3=a è un punto A 
re, allora in un intorno di a è possibile esprimere la soluzione generale nella 


forma 
w= CW +CgWo +... +CnWn 


ove 20), -.., 0, sono n. soluzioni fondamentali. Se ora si considera una curva 
chiusa che inizi e termini in @ e che non contenga punti singolari, si possono 
prolungare le soluzioni lungo questa curva partendo e ritornando in a. Se w; 
è una soluzione, poiché procedendo lungo la curva w; mantiene questo carat- 
tere, al ritorno in a si avrà che la soluzione trasformata wj è data da 


wi =a,%,+4,0,+...+0,Wp. 
In generale si avrà quindi un nuovo sistema di soluzioni 


W| = 4,190 + @9%03 +... +AnWn 
W09 = Ag,0, + Agg +... + dann 


Wn = An3W%0,+@ngWo+... + @nn®n 


ove dev'essere 
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altrimenti le soluzioni di partenza non sarebbero indipendenti. In altre paro- 
le, il sistema di soluzioni %,, ..., w, è sottoposto a una trasformazione lineare 
quando si considera una curva chiusa che non contiene punti singolari, Si os- 
serva come queste trasformazioni lineari costituiscono un gruppo, che viene det- 
to gruppo di monodromia dell'equazione differenziale. 

L’idea di Riemann si esprime dicendo che le proprietà delle funzioni definite 
dall’equazione differenziale sono espresse dal gruppo di monodromia piuttosto 
che dall’equazione differenziale stessa. 

Riemann mostrò come, assegnate n funzioni, uniformi, finite e continue, 
salvo che in punti eccezionali, e assegnato un gruppo di trasformazioni su di 
esse come illustrato più sopra, fosse possibile costruire un’equazione differen- 
ziale avente per soluzioni le funzioni assegnate. Questo argomento, trattato da 
Riemann in forma particolare, diede luogo al «problema di Riemann», che fu 
risolto in maniera completamente soddisfacente da Hilbert (1905). 

Contrariamente a Riemann, Fuchs considerò invece direttamente l’equa- 
zione differenziale, con l’obiettivo di ottenere nell'intorno dei punti singolari 
sviluppi in serie che ponessero in luce la natura di questi. Si consideri, per 
semplicità, il caso di un’equazione del secondo ordine w'+ (2) w'+9(2) w=o0 
(ancora si può osservare come questo caso contenga molti esempi interessanti: 
la equazione di Bessel, la equazione di Legendre e quella ipergeometrica). 
Si supponga che il punto singolare in esame sia posto nell’origine e che esista 
un cerchio .S che non contiene altri punti singolari. Come è stato osservato, 
se si considerano un punto #=4 in S e una curva chiusa che non contenga 
l'origine che inizia e termina in @, le due soluzioni fondamentali sono sotto- 
poste ad una trasformazione 


wi (2) = 43 21 (2) +43 (2) 
w3(2)= 491 21 (2) +43, 0,(2). 
Ci si può ora porre il problema se sia possibile determinare una soluzione che 
risulti inalterata quando si considera una curva come sopra, ma si vede facil- 
mente come in generale questo non sia possibile; ed allora si può chiedere 
la condizione meno restrittiva che una soluzione sia alterata semplicemente 
per un fattore moltiplicativo. Questo, considerando una soluzione della forma 
 w,(2)+u w,(2) conduce alla richiesta 
A (4,1%, (2) +-219%,(2)) + (291%, (2)+439%, (2)) = AD w, (2) +4 %03 (2)] 
cioè al sistema 
(a1-k)A +agp=o 
d2A+(4,3—kA)u=o0 
che è risolubile se e solo se 
Qik 4, 


Aa dg kh 
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Si supponga che l’equazione di secondo grado che si deduce uguagliando a 
zero questo determinante abbia due radici distinte &,, Ae. Scelto un nuovo 
sistema fondamentale di soluzioni in z=4a, w,(z) sia la soluzione che viene 
moltiplicata per k,, w,(z) quella che risulta moltiplicata per ky. 

Si osservi ora che la funzione 27? risulta anch’essa moltiplicata per un 
fattore costante, esattamente e-?"°9 quando si considera una curva che cir- 
conda l’origine. Si può tener conto di questo fatto per far si che la funzione 
w;(2)-37? risulti inalterata quando si considera una curva chiusa che circonda 
l’origine. Dovrà essere quindi: k,-e-2”Î9=1 e cioè 


I 
=—.log k,. 
(o) > 0g Ri 


Se dunque si considerano pj= (1/27) log &, e p2=(1/27i) log k,, si ha che le 
due funzioni w,(2) 27?1 e w,(2) 37°: sono monodrome in S. Esse ammettono 
dunque uno sviluppo in serie di Laurent, cioè 


+00 
w,(2)= 291)" 2,3” 
“oo 
wy(2)= 22) b,2”. 
00 
Nel caso invece in cui le due radici £, e 4, siano uguali si ricavano le soluzioni: 


400 
w,(2)= 201) a,3” 
“oo 
wy(2)=2?2 >; b,,2"+k w,(3)-log(2). 


Questi risultati dicono che nel caso di un punto singolare di un'equazione lineare 
del secondo ordine è possibile descrivere esattamente la natura dell’eventuale 
polidromia delle soluzioni: essa proviene o da un fattore del tipo 3° oppure 
da log. 

Ci si ponga ora il problema di determinare gli sviluppi in serie che dànno 
origine alle soluzioni fondamentali. L’idea che si presenta naturale — e che 
appartiene a tutta la tradizione del calcolo differenziale — è quella di sostituire 
nell'equazione differenziale e di ricavare in tal modo i coefficienti @,, by. È 
chiaro come le equazioni risultanti contengano infinite incognite. Quello che è 
importante è che esse sono trattabili solamente nel caso che lo sviluppo in 
serie di Laurent contenga un numero finito di termini negativi. Questo pone 
una differenza molto importante per la forma delle soluzioni e spinge a dare 
la seguente 


DEFINIZIONE. Una singolarità isolata 2 =a di un'equazione differenziale è det- 
ta regolare se esiste una costante k tale che 


lim w(2)(2—a)F=o. 
z>a 
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Una caratterizzazione importante delle singolarità regolari che fa riferi- 
mento solo ai coefficienti (2) e g(2) è fornita dal seguente teorema di Fuchs: 


TEOREMA (Fuchs). Una condizione necessaria e sufficiente affinché == sia 
una singolarità regolare dell'equazione w'+p(z)w'+q(z)w=o0 è che 2p(2) 
e 2° g() siano regolari in z=o0. 


1.6. Equazioni differenziali non-lineari: teoria qualitativa. 


Per illustrare alcuni sviluppi della teoria abbondantemente motivata da 
quanto detto nella introduzione ci si riferirà al caso semplice di due equazioni 


dx dy 
a PR) ar 72089) 


ove Pe Q sono supposte continue e differenziabili con continuità in una certa 
regione S del piano (x, y). Con queste ipotesi si ha che per ogni punto (xg; Vo) 
e per ogni £, con —co<fy<+c0 esiste esattamente una soluzione x=(t), 
y=4(t) con x0=@(t0), vv=U(t0) la quale è definita per tutti i valori # in un 
certo intervallo (7, 7). Un risultato molto semplice e molto importante è fornito 
dalla proposizione seguente: 


PROPOSIZIONE. Se S.S è una regione chiusa e limitata contenuta in .S e 
se x=p(t), y=Y(?) è una soluzione definita in (t, 7) tale che il punto (@(t), 
4(t)) è in S per tutti i te (1, 7), allora 7= —c0 e T= +00, 


Si prendano ora in esame alcune proprietà importanti delle soluzioni del 
sistema: 


1) Se x=@(t), y=y(f) è una soluzione del sistema definita in (7, 7) allo- 
ra x=@(#+C), y= WU (t+C) è ancora una soluzione in (r—C, T—C). In- 
fatti, ovviamente, 


d Cc 

So P(p (t+C), $(1+0)) 
d(b(1+C 

Geo = Q(9(1+0), $+0). 

Ma 

dp(1+C) _dp(t+C) 
dt+C) di 

dy(t+C) dU(t+C) 
d(t+C) dt 


e quindi x=@(#+C), y=y(#+C) è una soluzione. 
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It) Due soluzioni x=9(t), v=U(t) e x=9(#+C), y=4(#+C) possono 
essere viste come soluzioni con condizioni iniziali gli stessi valori xo, Vo 
e un diverso fg. 

rr) Viceversa due soluzioni x=@(t), y=U(t) con gli stessi valori iniziali 
%o» Yo ed un diverso £, possono essere ottenute l’una dall’altra sosti- 
tuendo #+C a #. 


Da queste osservazioni segue facilmente che, se si associa ad una soluzione 
x=(t), y=wW(t) la sua «traiettoria», cioè il grafico nel piano (x, y) della curva 
definita dalle equazioni parametriche x=@(t), y=%y(t), si ha: 


Iv) Due soluzioni che differiscono solamente per la scelta del valore inizia- 
le #,, definiscono la stessa traiettoria. 

v) Per ogni, punto della regione S vi è esattamente una traiettoria del 
sistema. 


L’interpretazione geometrica della quale ci si è serviti per illustrare i punti 
Iv) e v) è molto importante. Le soluzioni del sistema si interpretano come curve 
sopra un certo piano (x,y), che viene detto piano delle fasi. Queste curve 
sono descritte al variare del tempo £. Se x= g(#), y=t(t) è una certa soluzione, 
si ha 


sio =P(9(1), 40) IL) _ 0 90), VO) 


e dunque P e Q descrivono la velocità delle traiettorie. È naturale allora chia- 
mare un punto (a, d) ove sia P(a, 5)=0O(@, 5)=0 un punto di equilibrio. Se 
pensiamo di ricavare dal nostro sistema l'equazione differenziale ad esso equi- 


valente 
dy [dx _dy _Q(2,9) 


di/dt dx P(x,9) 


Si giustifica dunque per un tale punto (a, 5) anche la denominazione di punto 
singolare. 

È naturale che lo studio dei punti singolari abbia molta importanza per 
indagare il comportamento delle traiettorie del sistema. Questo studio si 
effettua con relativa facilità se nell’intorno di un punto singolare (xo, Yo) il 
sistema può porsi nella forma 


d 
2 A(x-x0)+B(Y-J)+9 (1-90) 


dx 
CA xo) +D(y-yo)t+0(x—-x0,.9—-Vo) 


ove p e o sono infinitesimi di ordine superiore a V(e-x0+(y-v)?. In tal 
caso infatti è possibile dimostrare che il comportamento delle traiettorie nel- 
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l'intorno del punto singolare è il medesimo comportamento che presentereb- 
be il sistema 


dy 
2 4 (x—x0)+B(Y—%o) 
dx 


= C- %) +D(Y-vo) 
e dunque è possibile ridursi allo studio di questo sistema semplificato. Se si 


suppone, per comodità, che il punto singolare sia nell'origine, si ottiene infine 
il sistema 


dy 
dx 


Questo sistema, con una trasformazione lineare non singolare, può essere ri- 
dotto a uno dei tipi 


dy 

dt 

da, 

di 

dy 

dI 

dx 

di” 

dy 

3 di + ky 

dx 

e rieziiai —y 

Si consideri ad esempio il primo sistema. Ad esso si associa l’equazione 

D_p3 
dx x 


la quale ha integrale generale dato da log|y]=log]x]|+cost, ossia 
y=clef®. 


Avendo ora l’equazione esplicita delle traiettorie, si può studiare, in corri- 
spondenza ai vari valori di &, il tipo di singolarità. Per &>o tutte le traiettorie 


I 
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passano per o, e la singolarità viene detta un nodo. Se invece &<o, si ha 


lim y= e quindi una situazione del tipo TEOREMA (test di Dulac per le regioni semplicemente connesse). Si conside- 


ri il sistema 


PS 
ala 


Questa singolarità prende il nome di colle. In modo analogo si analizzano le 
altre singolarità. 

Come è stato osservato, l’esistenza, o la non-esistenza, di punti singolari 
ha grande importanza per determinare l'andamento delle traiettorie. Si capisce 
quindi come sia molto significativo il seguente 


TEOREMA (Bendixon). Sia C una tratettoria del sistema corrispondente ad una 
soluzione periodica (un ciclo). Allora nella regione limitata da € vi è almeno un 
punto singolare. 


Si accenna la dimostrazione di questo teorema, senza entrare in troppi 
dettagli, poiché è interessante osservare come anch'essa, come il teorema di 
esistenza ed unicità, si possa far discendere da un teorema del punto fisso. 
Occorre esattamente il seguente teorema: 


TEOREMA (Brouwer). Una trasformazione continua f : D+D, ove D è un do- 
minio omeomorfo ad un disco, ha almeno un punto fisso. 


Ora, tornando alla dimostrazione del teorema di Bendixon, si osservi che 
una traiettoria che abbia come punto iniziale (xp, Yo) contenuto in C è a sua 
volta totalmente contenuta in C, per la proprietà v), e dunque è definita per 
ogni valore di f. Di conseguenza, fissato (xo, Yo) vi è una traiettoria con 9 (0) = xy, 
v(0)=v Ora, fissato un valore #, si può considerare il punto (g(?), w(£)) 
sulla traiettoria per (xo, yo). Tenendo fisso # e lasciando variare (xo, Yo), Si 
ottiene un’applicazione della regione interna a C (che occupa il ruolo di D 
del teorema citato) in se stessa. Ora, per il teorema citato, quest’applicazione 
avrà un punto fisso, in altre parole un punto (x,, y;) tale che la traiettoria che 
«parte da esso» ritorna dopo il tempo #. Se ora si fa tendere # a o, si ottengo- 
no traiettorie percorse in tempi sempre più brevi. Sia #,, #,, ... una successione 
di valori di # che tende a zero, e siano (%;, Yt1); (%»» Y4g); --- i corrispondenti 
punti fissi. Da questa successione sì può estrarre una successione convergente 
ad (x*, y*). È ora del tutto intuitivo, ed è agevole dimostrarlo, come (x*, y*) 
sia il punto singolare richiesto. 

Questo teorema può anche essere interpretato come un test per l’esistenza 
o meno di traiettorie chiuse. In effetti se in una data regione non vi sono 
punti singolari, in questa non possono esservi traiettorie chiuse, altrimenti si 
contraddirebbe al teorema dimostrato. 

Un altro risultato in questo senso è dato dal 


dl P(x,9) 


e supponiamo che sia definito in una regione G semplicemente connessa. Sia B (x, y) 
una funzione continua definita in G per la quale la quantità 


3-(8 (0,3) P(0,3))+3-(2 (0,9) 26,9) 


non cambia segno. Allora non vi sono curve chiuse semplici che st possano ottenere 
come unione di traiettorie del sistema. 


Dimostrazione: Per assurdo sia I una tale curva. Allora l’integrale 
Sr(-BQ dx+BP dy) è nullo, poiché se x=%(?), y=y(1) sono le equazioni 
di I°, con o<#<T si verifica, con una sostituzione diretta, come sia nullo 
l’integrando. D’altro canto, applicando la formula di Green, si ha 


ò ò 
=| (-BO dx+BP dy)= —BP+T- 
o=f (-B04+2P4)-{[ (25P+3 50) 4x4 
ove Q è la regione limitata da I°. Poiché la quantità 
ò ò 
si (BP) + (80) 


deve avere segno costante, si ha una contraddizione. 

In particolare, dal teorema precedente, ponendo B(x, y)=1, si ha il «test 
di Bendixon». Se (dP/dx)+(d0/òdy) è di segno costante, non vi sono traiettorie 
chiuse. 

Come si è già avuto occasione di osservare, un altro problema importante 
nel campo delle equazioni differenziali non-lineari è quello della stabilità delle 
soluzioni. 

Si tratta qui di decidere, esprimendosi in termini intuitivi, se una traiet- 
toria, nello scorrere del tempo, manterrà le stesse caratteristiche o cambierà 
in maniera sostanziale; esprimendosi in termini astronomici, ad esempio, se un 
satellite continuerà a ruotare attorno ad un pianeta o si allontanerà indefini- 
tamente. 

Naturalmente vi sono molte altre possibilità di comportamento per una 
soluzione che corrispondono a molteplici definizioni di stabilità: stabilità 
senz'altro, stabilità asintotica, stabilità uniforme, ecc. Si preciseranno in ter- 
mini matematici solamente le due definizioni di stabilità e di stabilità asin- 
totica. 
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DEFINIZIONE. Una soluzione (x(t), y (t)) del sistema di equazioni differenziali 
(che supponiamo in forma generale, poiché per questa definizione non interviene 
il fatto che sia autonomo) 


dx 
7 1059 t) 


dy 
A 5 t) 


definita in (to, +00) è detta stabile se per ogni e>o esiste un $>o tale che ogni 
soluzione (#(t), 3(t)) che, definita per t=ty, soddisfa alla diseguaglianza 


V(& (to) x (t0))?+ (4 (to) 9 (10)? <d 
è definita per t>t, e soddisfa ulteriormente per ogni t=to la diseguaglianza 
(EM a+) <e 


La definizione di stabilità asintotica è invece la seguente: 


DEFINIZIONE. La soluzione (x(t), y (t)) è detta asintoticamente stabile se è sta- 
bile, e se, per ogni soluzione (&(t), $(t)) che soddisfa alla limitazione contenuta 
nella definizione di stabilità, vale ulteriormente 


mae V(£(0)_x()?+(I0)-9 (0)? =o0. 


In genere, per studiare la stabilità di una soluzione, si effettua una notevole 
semplificazione, di natura analoga a quando, studiando un punto singolare 
di una funzione, si trasporta questo punto nell’origine; nel caso in esame, si 
può supporre di esaminare la soluzione identicamente nulla (ossia un punto 
critico in (0, 0)). Si consideri il sistema 


dx 
FA in (£, Xi» %a) 
dx 
+ =fa (£, x %a) 


(ove si sono indicate le variabili con x,, x» per suggerire che la considerazio- 
ne si può estendere ad un numero qualsiasi di variabili x, %a, ..,%n). Sia 
(x, (t), x»(t)) una soluzione. Posti y,=%,—% (1) e y2=%2—xa(t), 


di 0) e (ie Sa (0) 0) 


dt dt dt 
dy, dx, dxg(t 
EEE) 


e quindi 
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dis, (4, V1+%1 (6), Vatu (6) At, 2100), 22(0)) 


dy, 
ssa (ti, vata (0), Data (1) fa (6, 21 (0), 20 (8); 


e infine 


dy 
f =g1(t,Y1 92) 


dy 
d raimi (£, V1 Da) 


con g;(#, 0, 0)=g2(#,0,0)=0. 

Con questa semplificazione, si illustra un importante risultato ottenuto da 
Ljapunov. 

Questo risultato si fonda sulla osservazione intuitiva che se l’energia totale . 
di un sistema fisico ha un minimo locale in un certo determinato punto di 
Ae allora la configurazione di equilibrio è stabile. Si consideri dunque 
il sistema 


dx 
"- =f,(%,, %9) 


dx. 
* =fx(%,, %2) 


(la dimostrazione si ripeterebbe inalterata per n-variabili e nell'esempio suc- 
cessivo si applicherà il teorema nel caso generale; la dimostrazione nel caso di 
due variabili tuttavia è completamente esplicativa), e sia (0, 0) un punto critico 
isolato. Sia IT'=(x,(#), x» (#)) una traiettoria del sistema in una regione conte- 
nente (0, 0) e sia E(x,, x) una funzione continua con derivate continue in ta- 
le regione. Lungo T' si ha: 


dE_dE dx,  dE dx, dE , dE 
di dadi dd dell'a 


Supponendo ora che E(0, 0)=o0, si dirà che E è definita positiva se E(x,, x,)>0 
per (x, xo) # (0, 0); si dirà che è semidefinita positiva se E(x,, x.)=0 per 
(x, x):40. Si dirà poi che E è una funzione di Ljapunov se è definita positiva 
e se 


dE dE 
FIL tifa 


è semidefinita negativa. Questa richiesta equivale a dE/di<o e dunque E è 
non-crescente lungo I°. Fissando l’attenzione su un intorno dell’origine, ove 
s'immagina tracciata I°, si chiede in sostanza che £ (che generalizza l’energia 
totale) abbia un minimo. È ora possibile enunciare il seguente teorema: 
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TEOREMA. .Se esiste una funzione di Ljapunov E(x,, x.) per il sistema 


dx 
x =f,(%,, %2) 


dx. 
* =fa(%1, 2) 


allora il punto critico (o, 0) è stabile. Se inoltre la funzione E(x,, x») ha la pro- 
prietà ulteriore che la funzione 


dE f gdE fi 
du, dx’? 
sia definita negativa, allora il punto critico è asintoticamente stabile. 


Dimostrazione: Ci si limita alla prima parte dell’enunciato. Sia U un in- 
torno chiuso di (0, 0) ove E sia definita. Poiché E è continua e positiva, avrà 
un valore minimo m in U. Poiché E(0, 0)=0 ed £ è continua, è possibile 
trovare un intorno U' ove sia E(x,, x»)<m. Sia ora (x, (t), x» (t)) una traiettoria 
con (x, (#0); xe (t0)) e U”. Allora E (x(t), v(t0))<m e poiché E è definita negativa 
si ha dE/di<o ed allora E(1)<E(t,). Ne segue che la traiettoria (x,(t), x3(t)) 
non può lasciare l'intorno U”. 

Da questo teorema si possono trarre importanti conseguenze, ad esempio 
per le equazioni di movimento di Hamilton ($ 3.3). Si enuncia il risultato nel 
caso di un massimo anziché di un minimo. Considerando un sistema olonomo 
conservativo ove g; siano le coordinate generalizzate e ), i momenti, se 7 indica 
l'energia cinetica (che è una forma quadratica definita e positiva nelle );) e 
U=U(g,) 49, «»-: In) indica l’energia potenziale, si hanno le equazioni di mo- 
vimento 


Gi H@p=T-U 
chi DE 
dt ti dg; 
Assumendo che in gj=9,=...=9,=0 vi sia una posizione di equilibrio e che 


U abbia un massimo, allora U è definita negativa e H è definita positiva. Si 
ponga E= H. Poiché ZH non dipende da #, si ha 4H/dt=0. Se ne conclude che 
se nella posizione di equilibrio l’energia potenziale ha un massimo, l’equilibrio 
è stabile. 


1.7. Il moto kepleriano. 


In questo paragrafo si accennerà a come sia possibile dedurre le leggi di 
Keplero a partire dalla legge di attrazione di Newton. Schematizzando il pro- 
blema, si consideri (fig. 4) una piccola particella di massa m (un pianeta) 
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attratta da una grande massa M (il Sole) e si supponga che MM eserciti una forza 
f diretta da m verso M (moto centrale). Anche l’accelerazione sarà allora diretta 
nello stesso modo. Se P è la posizione occupata da m, si ha dunque, indicando 
con v e a rispettivamente la velocità e l’accelerazione; 


(P_O)Aa=0 
cioè 


d 
glP-0)AM=0 


il che implica 
(P-_O)Av=ce 


(c costante). Il moto avviene dunque in un piano passante per O e perpendi- 
colare al vettore e, in altre parole si tratta di un moto piano. Sarà dunque con- 
veniente particolarizzare in tal senso la scelta del riferimento. Ancora per 
semplificare i calcoli si utilizzerà il sistema di coordinate polari. 

Con riferimento alla figura 5 si ha r=ru,, dove u, è il vettore unitario 
diretto nella direzione di r. E poi 


u, =i cos9+j sin9 
us=—isin8+j così 
e quindi 
du, duy 
Bu 


Si ha allora, per la velocità e per l’accelerazione, 


v=-d_,° dr 
ca ap 


ae AA dr dè d*r d3\? 
di \Vdae' kate x) Joe 


Figura 4. 


Una particella di massa m (un pianeta) è attratta da una grande massa M (il Sole). 
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Figura 5. 


Il moto kepleriano è descritto agevolmente in coordinate polari. 


Scrivendo la forza f agente su m nella forma f=f,u, ( fa==0 perché f è centrale), 
si deduce dalla seconda legge di Newton: 


| d°d dr 5) 
m + 1 |j=0 


"RA 
d?r d9\? 
ml (#)) A 
Allora 
d°9 = drdd 


‘dead 
Moltiplicando per r si ha 


1° d°9 a dr CAO 
de‘ di di 
cioè 
d( 43 
__ r na = 
di\ dt 
Il che significa 
dd 
7? na h (costante). 


Si consideri ora l’area A= A(#) descritta dal raggio vettore r. Si ha 


dA=r* Lal 
2 
e quindi si ottiene 
dA= s(e 3) di=th dt. 
2 di 2 


Da questa relazione infine si conclude 


A(t)-A(4)=2h%-t) 
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cioè la seconda legge di Keplero: il raggio vettore r descrive aree uguali in 
tempi uguali. 

Si osserverà come questa legge sia in realtà solamente una legge del moto 
centrale, poiché si è supposto semplicemente fg =0. Si supponga ora che, in 
accordo con la legge gravitazionale di Newton, sia 


Dalla seconda equazione si ha allora (ponendo GMm= k) 


dr (d3\? k 
sa 
Si ponga ora al posto di 7 la variabile == 1/r e si usi è invece di # come variabile 
indipendente. Si ha allora 
d°z k 


La soluzione generale di questa equazione è data da 


z=Asin9+B 009944, 


e, prendendo il riferimento in modo che per 3 =o0 sia 
dz d?z 
dg d$? 
si ha A=o0, B>o. Posto nuovamente r= 1/2 si ottiene 
kh? 


ossia, ponendo e=B4?/k, 
ha 
CR 
"7 1+e così" 


e si ha dunque l’equazione di una ellisse, cioè la prima legge di Keplero: 
l'orbita di un pianeta è una ellisse della quale il Sole occupa uno dei fuochi. 

La terza legge di Keplero viene dedotta agevolmente dalle prime due: i qua- 
drati dei periodi di rivoluzione sono proporzionali ai cubi dei semiassi maggiori. 

La grande semplicità con la quale all’interno della meccanica newtoniana 
si deducono le leggi di Keplero, ricavate da questi sperimentalmente con pa- 
zienti e laboriosissimi calcoli, convincerà certamente il lettore della grande « for- 
za persuasiva» con la quale essa s'impose ai contemporanei. 

Tuttavia, ancora cento anni dopo Hegel rimprovererà al «barbaro» Newton 
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l’uso del concetto di forza come esplicativo di alcunché. Ecco due passi assai 
significativi. Nella lettera a Goethe del 24 febbraio 1821, si trova: « Vedo invece 
Newton, e dopo di lui tutti i fisici, afferrare qualsiasi fenomeno complesso e 
perdersi completamente in esso, e cosî imbrigliare il cavallo per la coda, per 
cosi dire. È accaduto a tal proposito che essi presentassero delle circostanze 
del tutto indifferenti allo stato primitivo della cosa... come se fossero le condi- 
zioni della cosa stessa — e ammassarvi, costringervi e introdurvi dentro tutto 
ciò che si trova davanti e dietro» [1835, trad. it. p. 201]. 

Ancora, nell’Enciclopedia [1830]: «L’idea di raggi luminosi discreti e sem- 
plici, o di particelle e fasci di essi, dei quali deve consistere una luce limitata 
nella sua espansione, fa parte di quelle barbariche categorie, che Newton in 
ispecie ha rese dominanti nella fisica» (trad. it. I, p. 245). 

Questa polemica tra Hegel e Newton viene spesso considerata con molta 
sufficienza, soprattutto da parte degli scienziati, i quali, immersi nella viva 
dialettica della scienza, sono spesso su posizioni filosofiche assai ingenue e 
profondamente antidialettiche. Ma a che cosa si contrappone in realtà Hegel? 
Pit che contro Newton, la critica hegeliana è rivolta contro gli sviluppi successivi 
della filosofia newtoniana, in altre parole contro il meccanicismo e il suo portato 
estremo, il determinismo. In esso Hegel non poteva non vedere che un’atroce 
parodia dello Spirito che liberamente si autodetermina. 

Sarebbe assai interessante seguire per tutto l’Ottocento e fino ai nostri 
giorni lo sviluppo ed il progressivo decadere delle posizioni deterministiche, 
ma andremmo assai al di là dello scopo di questo articolo. Ci si limita semplice- 
mente a ricordare l’evoluzione di pensiero che si è avuta intorno al problema 
degli x corpi. 

Dopo la risoluzione del problema dei due e dei tre corpi, le difficoltà in- 
sormontabili relative al problema dei quattro corpi hanno cominciato ad 
ingenerare l’idea della necessità di un approccio diverso, ad esempio di tipo 
statistico. Ma questo approccio genera come conseguenza il vanificarsi delle 
posizioni deterministiche. Che importa dove sta il singolo corpo ad un dato 
istante? Ben altri parametri occorrono per descrivere il movimento globale! 
Non si può non riconoscere un notevole valore nella polemica citata alla posi- 
zione hegeliana. 


2. Equazioni alle derivate parziali. 


2.1. Esempi, definizioni. 


Si veda come primo esempio quello dell'equazione delle corde vibranti. 
Questo problema era stato considerato da Giovanni Bernoulli il quale aveva 
trattato una corda vibrante come formata da n oggetti puntiformi pesanti, 
ugualmente distanti, congiunti da tratti di corda perfettamente elastici senza 
peso. In tale ipotesi, se s'immagina una corda di lunghezza /, disposta sull'asse 
delle ascisse, come nella figura 6, e si indica con xy l’ascissa della &-esima massa, 
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si ha xx =K(1/n). Se si indica con uy lo spostamento della A-esima massa, l’equa- 
zione ottenuta da Giovanni Bernoulli era 


d°u, {na\? 
ma Vip (Vis 2% 4x1) 


dove si pone a*=/7/M, indicando con 7 la tensione che è supposta costante, 
e M la massa totale. 

D’Alembert, successivamente, si pose il problema della corda «continua». 
Una maniera naturale era quella di concepire la corda come formata da infiniti 
pezzi, sostituendo u con u(t, x) e //n con Ax. In tale ipotesi l'equazione di 
Bernoulli si riscrive: 


du e n] 


dt? (Ax)? 
Facendo tendere Ax a o, si ottiene l’equazione: 
du du 
— = a? — 
(1) 07 da 


ove ora a?= T/c, c essendo la massa per unità di lunghezza. Supponendo la 
corda fissata agli estremi, si hanno le condizioni ulteriori u(t, o)=0 e #(0, /)=0. 
Se si suppone poi che al tempo t= 0 la corda abbia una configurazione assegnata 
da una certa funzione f(x), si ha la condizione ulteriore u(0, x)=f(x). Ancora, 
si può assumere la condizione che ogni particella abbia all’istante #=0 velocità 
nulla, e dunque 
du(t, x) 
dÌ jo 


La soluzione della (1) fu trovata da d’Alembert in maniera molto abile, 
osservando che la soluzione generale di un’equazione del tipo (1) è della forma 
ult, x)=@(at+x)+y(x—at). Questa osservazione è suggerita dal fatto che 
una funzione del tipo 9(af+x) prende nel punto x all’istante # il valore che es- 
sa prende nel punto x+at all’istante o. Se s'immagina che g(at+x) rappre- 
senti in ogni istante la forma globale della corda, essa è ottenuta da @(x) con 
la traslazione — at. In altre parole 0(x+at) rappresenta un’onda che si propa- 


Figura 6. 
La corda vibrante. 


26 
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ga verso sinistra con velocità a. In modo analogo s’interpreta y(x—at) co- 
me un’onda che si propaga verso destra. Pensare ad una soluzione del tipo 
p(r+at)+d(x- at) equivale quindi a pensare ad una soluzione come due 
due che si propagano in direzioni opposte, il che è abbastanza plausibile dal 
punto di vista fisico. Posti ora x+at=X, x—at=Y, cioè x=(X+ Y)/2, 
t=1fa[(X—Y)/2] si ha: 
ò d dd ent d? Fal 
da IX 3Y cioe Ga T3x3* x dr 37? 


d_(d òd a __ » a 
si <(-57) co° a \ax3 ° dx dY dv?) 
Allora si ha: 


e l'equazione assume la forma semplicissima 
du 
dX dY 
Questa equazione si risolve immediatamente, du/dX=(X), e quindi = 
=9(X)+U(Y). Sostituendo si ha infine u=9(x+at)+y(x—at). La condi- 
zione u(t,0)=0 dà 
o=p(2)+)(—at), 
cioè, posto t'=at, p(t)=-—W(-#) e quindi 
u=@(at+x)—9(at-x). 
Poi, osservando che anche «(t, /)=0, si ha 
g(at+1)—(at-1)=o0, 
cioè 
-g(at+1)=@(at-1) 
e dunque g è periodica in at+x, di periodo 2/. Dalla condizione 
du 
Òt [0 


si ha ancora 


p'(x)=9"(-2) 


e cioè p(x)=—9(—x). Allora (0, x)=p(x)-9(-x)=9(x)+9(x)=29(x). 


Essendo u(0, x)=f(x) si ha 2@(x)=f(x). Finalmente 


u(t, x)=2f(at+x)-1f(-at+2). 
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La soluzione di questo problema fu data da d’Alembert anche con un altro 
metodo, quello della separazione delle variabili. Questo metodo, come si è 
già avuto occasione di vedere trattando delle equazioni differenziali ordinarie, 
diverrà una tecnica fondamentale per la risoluzione delle equazioni alle derivate 
parziali. Da esso verranno dedotte molte equazioni differenziali ordinarie di 
grande importanza, come quelle di Legendre, di Jacobi e altre. Il metodo 
consiste in questo: si cerca una soluzione w che sia della forma 


u(x, 1)=f(x)g(1). 
Sostituendo nell’equazione differenziale, si ottiene: 


F"(@) 1 g"(1) 


fa) d&g) 
Questa equazione è soddisfatta nel modo più generale se si pone 


PO: a 


FR) agli 


cioè 
S()+w?f(a)=0, g'()+w%22g(1)=o. 
Le soluzioni generali di queste equazioni differenziali sono: 


f(x)= A cos wx+B sin wx 
£(t)= C cos awt+D sin aut. 


Imponendo al prodotto f(x)g(#) le condizioni al contorno si ottiene A=o0, 
A cos wl+B sin wl=0; e cioè, se non si vuole v identicamente nulla, sin w/=0 
cioè w/=nr. Allora w deve essere della forma xn/l. 

Per ogni numero intero x si ha dunque la soluzione 


», 


._ NT ant ._ ANT 
mesa Pal4, cos t+B, sin Gre) 


la quale, ponendo A,=), c0s Yn, B,=—A, SIN yy, può scriversi nella forma 
._ NT NT 
U,=, sin Prccon(a7 +1). 
Se ora si forma la serie 


u =Zu=IM sin Pacco. (d7 +1) 


questa, data la linearità dell'equazione (purché questa serie sia convergente), 
darà ancora una soluzione. Tenendo conto delle ulteriori condizioni iniziali si 


ricavano X,, Yn € quindi A,, B,. Precisamente si trova che B,=0 e che gli 
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A, (in termini moderni) sono i coefficienti dello sviluppo in serie di Fourier 
di f(x). Più in generale, se si fosse assunto come condizione iniziale 


du(t, x) es) 
dt Jo 
anche i B, sarebbero risultati i coefficienti di Fourier dello sviluppo di £(2). 

Un altro esempio molto importante è quello costituito dall’equazione di 
Laplace. boa 

Come si è già avuto occasione di accennare, uno dei maggiori problemi del 
secolo xvmi è la determinazione dell’attrazione gravitazionale che una massa 
esercita su un’altra (Sole, pianeti). Quando si considerano due corpi molto 
distanti, questo problema può essere schematizzato pensando a due corpi 
puntiformi. Se però quest’ipotesi non è più plausibile, come nel caso della 
Terra e di un corpo nell’atmosfera terrestre, occorre tenere in considerazione 
anche la forma dei corpi. ci. 

Si consideri il caso semplice di un corpo esteso 7 che eserciti una certa 
determinata attrazione su una particella, che si suppone puntiforme, M (fig. 7). 
Se s’immagina che l’attrazione gravitazionale che si esercita su M sia la somma 
delle attrazioni che esercita ogni particella di 7 possiamo scrivere in forza della 
legge di Newton, con i simboli usati nella figura, le componenti della forza che 
la particella di volume dx dy dz esercita su M: 

X-x 


fx=- kg dx dy dz 


72 


fe=— ho 122 de dy de 


7? 


Z-z 


fz=-— kg dx dy dz 


72 


r=\(X-xP+(Y-y?+(Z-2) 


M=(X, Y, Z) 


Figura 7. 
Rappresentazione dell’azione di ogni particella di T su M. 
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ove & è la costante di Newton. La forza esercitata dal corpo ha allora le com- 


ponenti: 
{x--4/({ ie TI 
fit 


t5=-+[{[ P 17? du dy da 

T 

Iz2=-a[{[ 057% du dy de. 
Vil 


Ora, invece di trattare separatamente fx, fy, fz, si può introdurre la funzione 


V(X, r,2)-[[[fada 
T 


e da questa si riottengono fx, fr, fz con 


ÒV 1 OV 1 ÒV I 
rag) SL HT a Ir 


La funzione V cosi introdotta viene detta potenziale. Il vantaggio di lavo- 
rare con questa funzione — a parte il significato fisico molto importante che si 
riesce a collegarle — è che in tal modo si utilizza una sola funzione, anziché tre. 
Nota V, si calcolano poi le componenti della forza calcolando le derivate. 
Il fatto principale riguardo alla funzione V (poiché il calcolo diretto di essa 
non è molto agevole) è che essa verifica l'equazione alle derivate parziali 


dV_9V_dV_ 
DX? dY? dz? 


il che ha spinto a uno studio sistematico di quest'equazione. Laplace in par- 
ticolare diede importanti contributi al suo studio, ed essa è nota oggi, in effetti, 
come equazione di Laplace. 

Come si è visto, si giunge a quest’'equazione considerando la funzione V, 
le cui derivate forniscono le componenti della forza richiesta. Quest’idea, di 
far discendere le componenti di una forza da una funzione potenziale, era già 
stata utilizzata in altri settori della matematica da Daniele Bernoulli e da Eulero. 

Se si considera un fluido in movimento e %, v, w indicano le componenti 
della velocità di una particella in un punto, Eulero aveva mostrato come si 
dovesse ritenere la quantità 4V=wdx+vdy+w dz un differenziale esatto. 
L'ipotesi che durante il movimento non si crei e non si distrugga materia si 
esprime con l’equazione differenziale 


de DE DI 
dx dy do 


e tenendo conto del fatto che dev'essere 


(0) 


(e) 
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= y=—— w= 


òx Òy òz 


si ottiene ancora l’equazione differenziale alle derivate parziali 


dv dV_èV_, 
da ay de 


L’equazione del calore fu ottenuta da Fourier considerando il problema 
di determinare la temperatura 7 in un corpo omogeneo ed isotropo come una 
funzione T'(x, y, 2, t). Sulla base di principî fisici, egli pervenne all’equazione 
alle derivate parziali 
dT dT OT po òT 


COMETE 


Trattando successivamente il problema in un caso particolare, cioè prenden- 
do in considerazione una sbarra rettilinea di lunghezza / isolata, Fourier con- 


siderò l'equazione 

dl di 
con le condizioni iniziali T(0,#)=0, T(0,)=0 per t>o, unitamente a 
T(x, 0)=f(x) per o<x</. Utilizzando ancora il metodo di separazione delle 
variabili, cioè ricercando una soluzione della forma T(x, 1)= (x) v(t), si arriva 
alle equazioni differenziali i 

u'' (x) +2 u(x)=0 
v'(1)+Xv(t)=0. 


Le soluzioni generali si ottengono con un tipo d’indagine analogo a quello 
svolto per l'equazione delle corde vibranti e quindi non si proseguono qui i 
calcoli. Va citato tuttavia un fatto molto importante. Tenendo conto della 
condizione iniziale T(x, 0)=f(x), Fourier si trovò a considerare un’uguaglianza 


del tipo 


> a, sinnx=f(x) 


la quale lo spinse ad affrontare il problema generale (già postosi in effetti per 
il caso dell'equazione della corda vibrante) della possibilità di esprimere una 
funzione qualsiasi mediante una serie di funzioni trigonometriche, cioè, come 
si dice oggi, «in serie di Fourier», 

Un problema molto simile di diffusione termica conduce all’equazione di 
Poisson. Questo esempio è molto importante, poiché per esso si presenta con 
molta chiarezza la significatività di due tipi di richieste iniziali, note rispetti- 
vamente come problema di Dirichlet e problema di Neumann. 

Si supponga assegnato un corpo nel quale vi siano sorgenti di calore costanti 
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nel tempo e se ne indichi con f(x, y, 2) la densità. Se ancora si indica con 
T(x, y, 3) la temperatura nel generico punto (x, , 8) si ha l’equazione 

ò°T èT è&T 

dat tai t aaa Sa). 


È chiaro come per determinare una soluzione si debbano ancora assegnare 
certe condizioni iniziali. Indicando con S la superficie del corpo considerato 
una prima richiesta molto naturale può essere 


(1) T(x,y,2)=a(x,y,z) per (x,y, 2)eS, 


na di assegnare la temperatura sulla superficie esterna. Un'altra richiesta 
altrettanto naturale può però essere quella di assegnare il flusso di calore 
attraverso S; cioè, se si indica con v il vettore normale ad S, di chiedere che 


òT(x, y, 8 
@ SP 5(,Y,2) per (89,65. 


Le richieste (1) e (2) costituiscono appunto i problemi di Dirichlet e di Neu- 
mann. 
Dall’equazione di Poisson, come caso particolare = i 
riottiene l'equazione di Laplace: i dae 
ò°T 0°T èT 
dx dy" da? où 


È ancora molto importante il caso di un’equazione di due variabili (x 9) 
che verifichi l'equazione di Laplace, cioè i 


du du 
dx? dy? ni 
Se infatti f(2)=f(x+iy)=w(x, y)+iv(x,y) è una funzione analitica, u e v 


RAP, . 5 
sono soluzioni dell'equazione di Laplace. In questo caso si dice che u e v sono 
funzioni armoniche. 


3 Come ultimo esempio, si citano le equazioni di Navier-Stokes, che regolano 
ò movimento piano di un fluido viscoso non comprimibile non soggetto a 
De sg con w(x, y, #), v(x, y, t) le componenti orizzontale e verticale 
ella velocità, con da, V, t) € p(x,y, t) la pressione e la densità, è possibile 
trovare una costante u in modo tale che si abbia 
put puu,t peu, tp, = (Uzgttyy) 
PV + puvzt 0v0y+dy= (Var +0 yy) 
U,+t0,=0. 


o. 


In generale queste equazioni sono di difficile integrazione. Esse si possono 

e RE se si assume che il fluido sia in moto «lento». In 

tal caso si ha infatti i i i i i 
tti che il termine p (uu, +0u,,) nella prima equazione e il ter- 
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mine p (uv,+v0,) della seconda equazione possono essere trascurati e si ha cosi 
il sistema 
pPUrtd,=U (Ut Uyy) 
petdpy=U (Org t Uyy) 
U,t0,=0 


il quale può essere trattato assai più agevolmente. 
Gli esempi dati dovrebbero ora avere rese completamente chiare le defini- 
zioni che seguono. 


DEFINIZIONE. .Sî dice equazione alle derivate parziali di ordine n un'espressione 
del tipo 


du du d°u sE) 


15 29 0009 mo > CAO Li Dina n 
| Òx, ÒdXm dxi dal 


Per soluzione di quest’equazione s'intende una funzione u(x,, %3, ..-,%m) che, so- 
stituita nell'espressione insieme alle sue derivate parziali, la renda identicamente 
soddisfatta. 


Se ad esempio si considera l'equazione ò°/òx®=o0, si ricava da questa 
uguaglianza du/èx=f(y), e quindi u(x,y)=xf(y)+g(y). La soluzione cost 
trovata è la più generale soluzione dell’equazione alle derivate parziali, nel 
senso che ogni soluzione dell’equazione può essere espressa in questa forma. 
In generale, per un'equazione alle derivate parziali arbitraria — come del resto 
accade per un’equazione differenziale ordinaria — non è possibile dare una for- 
mula che esprima tutti gl’integrali dell'equazione. Però ancora si può defini- 
re l’integrale generale come una formula che esprima con sufficiente grado di 
generalità le soluzioni dell'equazione. Si può cosi dare la definizione: 


DEFINIZIONE. Si dice integrale generale di un’equazione alle derivate parziali 
una formula che, con eventualmente qualche eccezione, esprima la totalità degli 
integrali dell'equazione data. 


Dal semplice esempio illustrato, si osserva come l’equazione è°u/dx?=o0, 
che è del secondo ordine, abbia una soluzione che dipende da due funzioni 
arbitrarie. Questa circostanza è del tutto generale, poiché vale la proprietà: 
l’integrale generale di un’equazione di ordine 7 dipende da n funzioni arbitrarie. 
Di questo fatto si può dare un’illustrazione di natura qualitativa. È chiaro come 
per l'equazione d"u/dxf=0 la soluzione dipenda in effetti da n funzioni. Se 
ora si considera un’equazione alle derivate parziali che sia ponibile in forma 
normale e cioè risolvibile rispetto ad una delle derivate di ordine massimo, 
ad esempio x, (la quale ipotesi non è molto restrittiva), e si considera l'equazione 
nella forma 
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si può pensare che l’equazione è"u/dx*=0 sia ottenuta come caso limite quando 
si fa divenire f=0. È quindi naturale pensare che le soluzioni delle due equa- 
zioni debbano essere nello stesso numero. Questo ragionamento, per nulla ri- 
goroso, dovrebbe tuttavia essere d’aiuto per capire il fenomeno generale. 

_ Come si è avuto occasione di osservare negli esempi preliminari dell’equa- 
zione della corda vibrante, dell'equazione di Laplace, di quella del calore e di 
quella di Poisson, un’equazione differenziale non si presenta in forma astratta 
come «data l’equazione... trovare l’integrale generale». Piuttosto l’equazione 
- che, come si è visto, si può formulare in rapporto ad un problema fisico — 
è accompagnata da certi dati, le cosiddette «condizioni al contorno», che si 
pongono in maniera naturale accanto all’equazione stessa. Questi dati costi- 
tuiscono una parte essenziale del problema. Ad esempio, la dipendenza con- 
tinua e differenziabile della soluzione dai dati — che è un’ovvia necessità se si 
vuole dare un’interpretazione fisica della soluzione — non vale, in generale 
per le equazioni alle derivate parziali. Questo può essere illustrato con il seguente 
esempio di Hadamard. 

Si consideri l'equazione di Laplace (in due variabili) 


d°u d°u 
> n] [o] 
da  dy? 
con le condizioni iniziali 
du sin nx 
u(x,0)=0  —(x,0)= : 
òy n 


Questa equazione ha l’unica soluzione analitica 
I ; 
u(x, t)= Sh (ny) sin nx. 


Quando n, il valore iniziale per y=0 tende a zero uniformemente e la 


sola soluzione del sistema 
d°u du 
data 0 


u(x, = o)=0 


è u(x, y)=o. D'altro lato la soluzione (x,y) non tende a zero per n-+00 
Questo esempio suggerisce che i dati iniziali assunti per l'equazione 


du du x 
dx? dy? TA 


non sono ben scelti. Si motiva cosi la nozione di problema ben posto {nozione 
ancora dovuta a Hadamard). 


possibile considerare in astratto il problema della ricerca della soluzione 
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nel modo seguente: Sia dato un certo spazio funzionale (cioè uno spazio che 
ha per elementi funzioni) V. In esso si assegnino certi dati, cioè certe funzioni 
fofo fy Si cerchi ora una soluzione u appartenente ad uno spazio fun- 
zionale W. : 

Il problema è ben posto quando 1) fissati comunque i dati f,, ..., fp esiste 
una ed una sola soluzione 4; e 2) la soluzione è stabile, ossia dipende con con- 
tinuità dai dati. 

Ma anche per quanto riguarda l’esistenza delle soluzioni si ha un compor- 
tamento diverso per le equazioni alle derivate parziali rispetto alle equazio- 
ni differenziali ordinarie. L'esistenza di soluzioni e l'unicità valgono infatti 
in condizioni determinate. Per ottenere buoni teoremi occorre eseguire una 
classificazione delle equazioni alle derivate parziali (cfr. $ 2.2), cioè, in sostanza, 
occorre tenere in maggior conto la specificità dell’equazione che si considera. 
Si ha però un risultato di carattere generale molto importante, il teorema di 
Cauchy-Kowalesky, il quale può essere formulato per un sistema di equazioni 
del primo ordine in forma normale, ove si assumono come incognite certe 
funzioni ;(x,, ..., xy). I dati iniziali, in questo caso, vengono assunti nella 
forma nota come «problema di Cauchy», anzi vengono formulati come un 
problema di Cauchy particolare. 

Il problema di Cauchy è una generalizzazione naturale del problema dei 
dati iniziali per i sistemi di equazioni differenziali ordinarie o equivalentemente 
per una equazione differenziale ordinaria di ordine n. Se è data un'equazione 
differenziale di ordine x, per determinare una soluzione y (x) occorre assegnare, 
in un punto xp, il valore y(xo) ed i valori delle prime n—1 derivate y' (0) 
y° (xo). 

Se si considera un'equazione alle derivate parziali di ordine x, in due va- 
riabili x, y, verrà naturale chiedere che la funzione incognita (x, y), che si 
può interpretare come una superficie dello spazio x, y, 2, e le sue derivate fino 
all'ordine n——1 abbiano assegnati valori lungo una linea I° dello spazio. Se si 
considera invece un’equazione in m variabili x, ..., %m, si tratterà di assegnare 
i valori lungo una superficie ad m—1 dimensioni. Nel caso trattato dal teorema 

successivo, il quale si riferisce ad un sistema di equazioni del primo ordine in 
forma normale (è sempre possibile trasformare un’equazione in forma norma- 
le di ordine qualsiasi in un tale sistema), si considereranno assegnati i valori 
sulla particolare ipersuperficie data dall’iperpiano x,=0. 


TEOREMA (Cauchy-Kowalesky). Si consideri il sistema in forma normale 
; du, 

Si f(( 200) Haga Ups n 

dd ma dx, 


e si consideri il problema di Cauchy che consiste nell’assegnare sull'iperpiano 
Km = 0 le condizioni u;(x, Xay +0) Emo 0) = @;(%, ..., %m-1) € Si supponga ancora 
che le funzioni f; siano analitiche in un intorno del punto x,= 4, -.., %m-1=%m-1 
%=0, che le funzioni ©; siano analitiche in un intorno del punto x,=a1, ..., 


%1= mr Allora esiste una ed una sola n-upla di funzioni analitiche 
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U;(%,, + Xm) che soddisfa al sistema, alle condizioni iniziali, ed è analitica in un 
intorno di x1=4@,%3= 49, ...,%m_1=Um-1 %Wm=0. 

Non si esporrà la dimostrazione di questo teorema; si può osservare tuttavia 
come essa possa effettuarsi con il metodo della funzione maggiorante, come 
nel caso delle equazioni differenziali ordinarie. 


2.2. Equazioni del secondo ordine. Classificazione. 


È stato mostrato nelle pagine precedenti come l’esistenza e il buon com- 
portamento delle soluzioni di un’equazione alle derivate parziali siano legati 
in maniera essenziale, alla forma specifica dell’equazione stessa. Ne ma ue 
che una trattazione sistematica delle equazioni alle derivate parziali deve x 
cessariamente compiersi attraverso classificazioni delle equazioni stesse in tipi 
Ra tg anche conto dei dati iniziali come parte essenziale per questa 

Poiché le equazioni alle derivate parziali che maggiormente intervengono 
nelle applicazioni sono equazioni del secondo ordine, soprattutto se lineari Do) 
semilineari, ci si limiterà a trattare questo caso. Si può osservare, del resto 
che tutti gli esempi considerati in precedenza rientrano in questa trattazione. 

Un’equazione alle derivate parziali viene detta semilineare quando in essa 


le derivate di ordine massimo compaiono linear mente, ossia nel caso dell equa- 
, I Si 
zione del secondo ordine, 


2 
(1) A;;(%1,%2, ..., e. dia du 
L i, %% %n) dx; da, 17 xa +0 Eng dar "i dx, uj=o0. 


L equazione è Invece lineare se tutte le derivate compaiono linearmente ossia 
b) 


DE) 10%; 7 Òx 
+f(£,, ..., %,)=0. 
Per semplificare, si utilizzerà la scrittura (1) anche quando l’equazione è linea- 


re, in tal caso la 
du du 
13 X2, +13 Xn sis u 
( dx, àx, 


| Ò 
(2) VAi;(%,, -.., %n) Soa LB: Foiata) +0 (0 0.3 Gp) Ut 
v 


va pensata in modo che l’equazione abbia complessivamente la forma (2) 
chiaro come una parte essenziale, per quanto riguarda un’equazione alle 

derivate parziali dei tipi considerati, sia da attribuirsi ai coefficienti A;;(x 

..-, n) delle derivate seconde. ri 
Un suggerimento per semplificare lo studio dell'equazione alle derivate 

parziali proviene dalla geometria. Se infatti si considera il cambiamento di 


È n 
coordinate dato da X, "Lt l'equazione si riduce alla forma 
E 
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n 4 ) du 39 o 
sana unf °° +..=0. 
pp 120815 )35 XX, 


In altre parole, i coefficienti delle derivate seconde si comportano a korn 
della forma quadratica: Y A;;x;x;. Una tecnica fondamentale pet lo sa io del- 
le forme quadratiche consiste nel determinare il cambiamento di coordinate in 
modo che la forma quadratica sia ridotta a forma canonica, ossia alla forma 


S4x m<n 

q=1 
ove il numero dei termini con segno positivo e negativo è determinato dalla 
«legge d’inerzia delle forme quadratiche». Se dunque si ee un punto 
(x9, x9, ..., x°), è possibile individuare una sostituzione di variabili 


n, 
Xx=) dii 


q=1 
in modo che l’equazione assuma la forma 


du 
DA8% Lidia 3x0 


ove si ha 
Al =YAj Ari dj 
e, nel punto (x, ..., x0), sia 


Af(xi, «= tI Se i=j<m 
Ai... n) =0 se 1#j 0 1=j>m. 


La forma cosf ottenuta per l’equazione alle derivate parziali viene detta forma 
canonica nel punto (x, ..., x?). Naturalmente questa riduzione a forma a 
nica sarebbe ancora più utile e significativa qualora si potesse garantire che 
essa vale non solamente in (xî, ..., x?) ma in tutto un intorno di questo punto. 
Ma questo è, in generale, impossibile se il numero delle variabili è maggiore 
dà a non solo questa riduzione è impossibile con una trasformazione lineare, 
ma si può mostrare come, scelta una regione arbitrariamente igor non na 
possibile, e con qualsiasi trasformazione, ridurre ivi l'equazione a forma ca 
nonica. Questo mostra come vi sia una notevole diversità di complessità quan- 
do il numero delle variabili supera due. Per una trattazione sufficientemente 
semplice, quindi, si farà riferimento a questo caso, ossia all’equazione 


du 3a) 
=o0 


du du u 
CGA (E 


du B Asi 
A) +? (x, 9) dx dy 


ove la f deve avere forma opportuna quando l’equazione sia non solamente 
quasi-lineare ma addirittura lineare. 
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In questo caso la possibilità di ridurre l'equazione a forma canonica è legata 
al comportamento delle «caratteristiche», cioè dei due sistemi di curve definiti 
dall’equazione differenziale 


A(dy)?+2B dx dy+C(dxf=0 


ossia 


dy B+VE?—AC 
dx A ì 


Si hanno le seguenti possibilità: 


1) B°— AC<o: l’equazione viene detta ellittica. 
2) B®—AC>o: l’equazione viene detta iperbolica. 
3) B°—AC=o0: l’equazione viene detta parabolica. 


4) B®— AC non è di segno costante; in tal caso l'equazione viene detta di 
tipo misto. ° 


Si esamini ad esempio il caso 2). Se le equazioni delle linee caratteristiche 
dei due sistemi sono date nella forma @(x, y)= cost e y(x, y)= cost, e si pone 
X=o©(x,y) e Y=y(x, y), sostituendo nell’equazione si ha ora, poiché le linee 


caratteristiche sono date da X=cost, Y=cost, che questa deve ridursi alla 
forma 


d° du du 
SX Sp+(x Vu3x 57) 
Oppure, ponendo X=X'+Y" e Y=X'-Y', alla forma 


du du lu rr. du du 
ax 3ya i (1° Tibzg vv) 


Entrambe queste forme vengono intese come forme canoniche dell'equazione 
di tipo iperbolico. Nel caso ellittico, con analogo procedimento si ottiene la 
forma canonica 

du du du du 

gatasti(i Yu —;, —]= 

vcuicazi si Par) ù 


mentre nel caso parabolico infine: 


Esaminando ora gli esempi trattati in precedenza (pensati quando sia neces- 
sario nel numero di due variabili), si osserva come l’equazione della corda 
vibrante sia di tipo iperbolico, l'equazione del calore di tipo parabolico e le 
equazioni di Laplace e di Poisson di tipo ellittico. Questi esempi corrispondono 
a fenomeni fisici di natura diversa: fenomeni di propagazione ondosa, di diffu- 
sione nel caso dell'equazione della corda vibrante e del calore, fenomeni sta- 
zionari nel caso dell’equazione di Laplace e di Poisson. 
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Questi fenomeni riflettono in maniera molto precisa il comportamento delle 
soluzioni delle equazioni alle derivate parziali del gruppo al quale apparten- 
gono. È possibile cioè prevedere, per le soluzioni di un'equazione di tipo 
iperbolico, lo stesso tipo di comportamento delle soluzioni dell equazione del- 
le onde e cosi per quanto riguarda le equazioni di tipo ellittico € parabolico. 
Come conseguenza di questo fatto si capisce come le condizioni al contorno 
debbano essere opportunamente coordinate al tipo di equazione che si consi- 
dera. L’esempio di Hadamard illustrato in precedenza mostra in effetti come 
per un’equazione di tipo ellittico il problema di Cauchy in generale sia mal 
posto. I problemi naturali, in questo caso, sono quelli di Dirichlet e di Neu- 
mann. 


2.3. Qualche proprietà delle equazioni di tipo ellittico. 


In questo paragrafo si esamineranno alcune proprietà delle soluzioni di 
un’equazione di tipo ellittico [cfr. anche Bombieri 1974]. Già si è osservato 
come l’indagine intorno al comportamento delle soluzioni di un’equazione 
alle derivate parziali debba tener conto della specificità dell’equazione che si 
considera. In effetti nei risultati che si considerano è agevole vedere come da 
particolarità dell'equazione che si considera suggerisca dei procedimenti tipici 
non applicabili in altri casi. Nn 

Lo studio delle equazioni ellittiche si ottiene attraverso due principî fon- 
damentali: l ae | 

1) Le equazioni ellittiche descrivono lo stato stazionario di un certo si- 
stema ,S. Si comincia quindi con l’osservare che un tale sistema deve avere 
energia totale minima. Il primo che ha isolato in una qualche generalità questo 
principio è stato Fermat; esso viene denominato principio di minima azione, 
ed è di fondamentale importanza nell’ambito della fisica matematica (cfr. 
anche il $ 3). Il fatto che l’energia totale risulti minima viene espresso attra- 
verso equazioni o disuguaglianze che controllano l’integrale delle derivate del- 
la funzione per mezzo della funzione stessa e dei dati iniziali. È utile osser- 
vare che funzioni di tipo arbitrario non permettono questo tipo di controllo, 
e pertanto le funzioni che sono soluzione di equazioni ellittiche formano una 
classe notevolmente ristretta. In generale sono funzioni di comportamento 
estremamente regolare. A questo proposito si deve a Hilbert (1900) l’avere 
attirato l’attenzione dei matematici su questa proprietà caratteristica solle- 
vando la questione se le soluzioni di equazioni ellittiche analitiche siano neces- 
sariamente analitiche. La soluzione di questo problema è affermativa nel ca- 
so lineare (Bernstein, 1904) ed ammette invece eccezioni nel caso di sistemi 
non-lineari (cfr. Giusti e Miranda 1968]. Der 

2) Il secondo principio fondamentale valido per le equazioni del secondo 
ordine consiste nel principio del massimo. Da un punto di vista fisico questo 
principio s’illustra agevolmente attraverso l'esempio di una membrana elastica 
soggetta ai soli sforzi di tensione e fissata ad un contorno assegnato. Si vede 
allora che il punto di massimo innalzamento della membrana si trova sul 
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contorno. Nel caso di equazioni di ordine superiore, quale per esempio l’equa- 
zione per le piastre, il principio del massimo non è più valido. Una piastra 
metallica costretta a stare in un contorno assegnato (la s'immagini costretta 
dentro una morsa) potrà presentare dei rigonfiamenti all’interno se lo sforzo 
di tensione è abbastanza elevato. Anche in questo caso, però, esistono formula- 
zioni, di aspetto notevolmente tecnico, di risultati simili al principio del mas- 
simo che tuttavia hanno un’importanza minore nello studio delle proprietà 
delle soluzioni rispetto al principio del massimo classico. 

In questi due esempi si è anche visto il problema tipico per le equazioni 
ellittiche: l'assegnazione di dati al contorno che determinano in modo unico 
la soluzione stazionaria, stabile. Nel caso di un problema del secondo ordine 
come quello della membrana il dato al contorno consiste nell’assegnare i valori 
della funzione soluzione al bordo; per l'equazione di ordine superiore, come nel 
caso della piastra, si possono avere dati di natura diversa i cui esempi tipici 
sono la piastra appoggiata al bordo e la piastra incastrata nel bordo. In questi 
due casi la distinzione viene fatta assegnando, oltre al valore della soluzione 
al bordo, anche il comportamento della derivata normale. Questo tipo di con- 
siderazioni è alla base di tutti i trattamenti delle equazioni ellittiche, anche nel 
caso non lineare. 

Per vedere con maggior precisione un esempio tipico e fondamentale, che 
rappresenta tutti i fenomeni sopra descritti, si può considerare l’equazione di 
Laplace che corrisponde al caso della membrana elastica incontrata in pre- 
cedenza. Quest’equazione è fondamentale e si ritrova nei problemi più svariati. 
Incontrata da Laplace per la prima volta nei suoi studi sugli anelli di Saturno, 
incontrata nuovamente dai fisici nella descrizione dei campi elettrici e gravita- 
zionali, si ritrova anche nelle matematiche pure, nello studio delle funzioni 
analitiche di variabile complessa. In due variabili essa si scrive 

d°u du 
dat ay ° 

Un tipico problema al contorno per questa equazione è, come si è visto, 
il problema di Dirichlet: esso consiste nell’assegnare sul contorno I di una 
regione finita G del piano (x, y) una funzione continua f. Si tratta di trovare 
una funzione (x,y) che sia armonica nell'interno di G e uguale ad f su T. 

L'equazione di Laplace, nonostante rappresenti solo un esempio di equa- 
zione di tipo ellittico, è tuttavia esplicativa di molti fatti relativi al comporta- 
mento delle soluzioni dell’equazione generale di tipo ellittico. Si può formulare 
un principio di carattere pratico il quale consiste nel dire che ogni proprie- 
tà dell’equazione di Laplace, opportunamente riformulata, rimane vera per l’e- 
quazione generale. Si capisce quindi l’importanza dell’indagine intorno all’equa- 
zione di Laplace. 

Nel seguito si ricaveranno alcune proprietà delle funzioni armoniche assu- 
mendo che esista una soluzione del problema di Dirichlet. In effetti è possibile 
dimostrare, se si assume G semplicemente connessa, l’esistenza della soluzione 
del problema [cfr. ad esempio Petrovski 1950]. 
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Una importante proprietà delle funzioni armoniche, che in un certo senso 
continua i principî 1) e 2), è il teorema della media. Se u(x, y) è una funzione 
armonica nell’interno di un cerchio di raggio r di centro (xo, Yo) ed è continua 
sulla circonferenza, allora il valore della funzione nel centro del cerchio, 
u(xo, Vo), è uguale alla media dei valori assunto da w sulla circonferenza. Si 
ha, in altre parole, indicata la circonferenza con T, 


I 
ufo = | PVT. 
Tr 


Da questo teorema segue facilmente il principio del massimo. Di esso tut- 
tavia esiste una dimostrazione elementare molto elegante dovuta a Privalov 


[ibid., p. 169]. 
TEOREMA. Se (x,y) è una funzione armonica in una regione G e continua 
in GUT, allora essa assume il valore massimo ed il valore minimo su Tr. 


Dimostrazione: Sia m il massimo di w su T' e si supponga, per assurdo, che 
vi sia un punto Q interno a G ove w assume il valore massimo M. Si trasporti 
Q nell’origine con una traslazione e si consideri la funzione 


M- 
0 (x, 9) =u(8,9)+ 770° +99) 


ove d è il diametro della regione G. È chiaro che (0, 0)= (0, 0) = M. È chiaro 
anche che in un punto di I si ha 


0 (8, 9) <m+1(M-m)=2(m+M)<M 


e dunque v(x, y) deve avere il massimo in un punto interno. Ma 
dv dv du du M-m M-m 
da? | dy? da | dp dî © d? 


>oO 


mentre in un massimo nessuna derivata seconda deve essere positiva. Per la 
dimostrazione relativamente al minimo basta considerare —w. 

Da questo teorema si ricavano due conseguenze importanti, l’unicità della 
soluzione del problema di Dirichlet e la dipendenza continua dai dati. Se 
u, e u, sono due soluzioni, la differenza u—, è ancora una soluzione la quale 
assume su I valore zero, ma allora non potendo assumere nell’interno né valore 
più grande né più piccolo deve essere identicamente nulla, cioè U, = Up. Per la 
dipendenza continua si osservi che se w, e v, sono soluzioni corrispondenti a 
funzioni f, e fo su T' e si assume —e<f1 —fs <£, ne consegue che —e<u,—U<®. 

La proprietà di monotonia dimostrata per le funzioni armoniche si estende 
alle equazioni lineari omogenee del tipo 


du du du du du Da 
ATEO NPT) o 
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e dunque anche per queste equazioni possiamo garantire l'unicità della soluzione 
del problema di Dirichlet e la dipendenza continua dai dati. 

A conclusione del paragrafo si riporta un risultato di carattere negativo il 
quale mostra come non tutte le proprietà delle funzioni armoniche si possano 
trasferire senza alcun problema alle equazioni ellittiche. Si consideri l'equazione 
ellittica 


x 


per essa è possibile assegnare delle condizioni in modo che il problema di 
Dirichlet non sia risolubile. 


2.4. Soluzioni in senso debole. 


L’esigenza di generalizzare il concetto di soluzione di un’equazione alle 
derivate parziali proviene sia dal confronto con i problemi fisici sia dalla ne- 
cessità di una sistemazione dei problemi interni della teoria. Per quanto riguarda 
le esigenze interne della teoria si osserva che la necessità di una trattazione 
semplice e generale spinge a cambiare il concetto classico di soluzione. In 
effetti le due equazioni differenziali 


du a d°u 3 
Òx dy òy dx 


dovrebbero essere equivalenti, però la prima è soddisfatta da ogni funzione 
indipendente da y, mentre la seconda è possibile che non abbia alcun signi- 
ficato. 

Questo motiva l’introduzione di nuovi enti, le distribuzioni, in modo da 
eliminare questo inconveniente. Si arricchisce cioè il concetto di soluzione 
ammettendo come soluzioni, accanto alle funzioni, anche «funzioni generaliz- 
zate», appunto le distribuzioni. 

Assai più pressante è l’esigenza di arricchire il concetto di soluzione in 
rapporto a problemi che riguardano i rapporti della matematica con la fisica 
e in generale con il mondo esterno (vi sono notevoli equivalenze tra le soluzioni 
in senso distribuzionale che s’introducono nel primo caso e le soluzioni deboli 
o debolissime che s’introducono nel secondo, ma i due tipi di soluzione cor- 
rispondono tuttavia ad esigenze metodologiche diverse). Si considera ad esem- 
pio l’equazione di Poisson in due variabili 

d°u du 


se f(x, y) è supposta discontinua, cosa assai plausibile dal punto di vista fisico, 
non possiamo naturalmente chiedere che la soluzione sia continua insieme 
alle sue derivate seconde. Viene quindi naturale cercare, in rapporto a questo 
e ad altri problemi, una nuova definizione di soluzione. 

Si motiverà la definizione di soluzione debole con un esempio, mostrando 
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come essa sia deducibile in maniera molto naturale, partendo dal principio 
di Hamilton. Si consideri l'equazione della corda vibrante 


du = U 
TI x, È 

RIC) 
con le condizioni al contorno (o, #)=0, «(/, t)=0 e si cerchi una soluzione 
nel rettangolo Q dato da o<x<} e o<t<#. Se 4(x, t) è una qualsiasi funzione 
a quadrato assolutamente integrabile, ossia tale che 


[he )r40<+o, 
[o] 


allora vi è equivalenza tra il fatto che u sia soluzione dell’equazione della corda 
vibrante ed il fatto che w sia dotata di derivate seconde continue e verifichi 
per ogni 4 l’equazione 


du du 
[(E-S)aca-[ 140 


Questo motiva la definizione di soluzione quasi ovunque: 


DEFINIZIONE. Una funzione u(x,t) a quadrato assolutamente integrabile è 
detta «soluzione quasi ovunque » in © dell’equazione della corda vibrante se am- 
mette derivate prime e seconde a quadrato assolutamente integrabile e soddisfa 
u(0,t)=0, u(l,t)=o, e, per ogni h, 


du du 
[(fa- Sa) 40 [po 


Si è in tal modo generalizzato il concetto di soluzione, poiché non è più 
richiesta la continuità delle derivate seconde. 

Un'ulteriore generalizzazione del concetto di soluzione si può ottenere 
immaginando di ricavare l'equazione delle onde a partire dal principio varia- 
zionale di Hamilton. Al tempo t l’energia cinetica e l’energia potenziale della 
corda sono date da 


Allora l’azione hamiltoniana è data da 


[a-na-[K{R]e:[ Rae 
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L’azione deve risultare stazionaria quando si consideri una variazione (x, #) 
la quale sia della stessa classe funzionale di u e per la quale sia (x, 0)= 
=h(x,t)=o. In particolare, dovrà essere 4(0, #)=w(0, t)=0 quasi ovunque 
ed anche 4(/, t)=u(l, t)=0 quasi ovunque. Ne segue allora, imponendo l’an- 
nullarsi della prima variazione, 


è li ldu dh du dh 
0) [[EE di dx 31/1) dio. 


Quest’equazione può immaginarsi ottenuta a partire dall’equazione 
du du 
hd 
{.eraa)ta0=[ 40 
supponendo che % sia una funzione per la quale valgano le ipotesi della (1). 


In particolare dovrà essere dotata di derivate prime a quadrato integrabile. 
Infatti, si ha: 


du du pf (du) _d (de, du dA du dh 
di? dall \dt\dt dxldx }( di di dx de 
e quindi 


du du du dh du dh ò (du ò (du 
ji dQ=-||--—-— —i4h)-—{- ; 
Ka a) x KE di dx n) dol +f, EÉ a) (E n) da 
Ma segue facilmente, dalla formula di Green, come il secondo integrale sia 
nullo nelle ipotesi in cui siamo e perciò: 


du 0% du dh edu dh 
Fa ana [ (rr) 


Si è cosf verificato come la (1) possa essere ottenuta dall’equazione che 
definisce il concetto di soluzione quasi ovunque, restringendo la variabilità 
delle funzioni 4 che si considerano. Abbiamo cosi una soluzione più genera- 
le dell'equazione delle onde. Si ha dunque: 


DEFINIZIONE. u(x,#) è detta una soluzione debole in © dell'equazione della 
corda vibrante 
du d°u 
di? da? =f@,1) 


se è di quadrato assolutamente integrabile insieme alle sue derivate prime e sod- 


disfa l'equazione 
du dh du dA 
Kata) 


per ogni h(x, t) tale che sia h(x, 0)=h(x, î)=h(0, t)=h(1, t)=o quasi ovunque. 
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Questo esempio è completamente esplicativo di cosa si debba intendere 
in generale per soluzione debole di un’equazione alle derivate parziali. Si 
noterà come in questa definizione compaiono solamente le derivate prime della 
funzione x. 

Come si è già osservato, un altro modo per generalizzare il concetto di 
soluzione proviene dalla considerazione delle distribuzioni. 

Una collezione di soluzioni di un’equazione alle derivate parziali, quando 
è pensata come uno spazio funzionale, non è in generale, rispetto ad una metrica 
che si considera, uno spazio completo. Le distribuzioni possono essere intro- 
dotte (Sobolev, 1936) per questa via, completando lo spazio. 

Sia Q un dominio convesso del piano e si consideri una funzione f(x, y) 
che sia definita e continua insieme alle sue derivate fino all’ordine / in un 
certo dominio contenente Q. Si può introdurre la norma 

dd) ; 


Ifl= | Î f, TOLTI Il 09)", 


dali dy: 
e si ottiene uno spazio vettoriale normato, denotato W®. Il completamento di 
questo spazio, che si indica con W®, è lo spazio di Sobolev. Per farsi un’idea 
di come siano costituiti gli elementi di questo spazio, si consideri un elemento 
Fin W® ma non in W®. Per definizione esiste allora una successione {p,(x, )} 
tale che 


per 2-00. 


pn (x, 9) —f(, 9) ly +0 
Ossia 


il 10m (x, D)—P, (, 9)? dx dy>o 
@ 


SK 


Per la completezza di L n (0) esistono allora delle funzioni go, g{!2, alle quali 
convergono le successioni di Cauchy {p,} e {(d'p,/dxh dl). Identificata 
f con go, PL! sarà la derivata generalizzata di ordine / di go. 

Si è cosf definita la derivata generalizzata, o, in senso distribuzionale, di 
un elemento dello spazio di Sobolev. Gli elementi dello spazio di Sobolev 
vengono detti distribuzioni e quanto si è visto equivale ad una generalizzazione 
a questi elementi del calcolo differenziale ordinario, poiché è possibile dimo- 
strare che le derivate in senso distribuzionale hanno le usuali proprietà che 
esse possiedono nel calcolo ordinario. In particolare, naturalmente, se una fun- 
zione è già derivabile, le sue derivate in senso distribuzionale non sono altro 
che le derivate ordinarie. 

Disponendo di un nuovo, più generale concetto di derivata, è possibile 
naturalmente riformulare la nozione di soluzione di un’equazione alle derivate 
parziali în senso distribuzionale. Si può mostrare come la nozione di soluzione 
debole data in precedenza possa essere interpretata in senso distribuzionale. 


ed anche 
don 


p 
sol TASTE deliSyh dyla dx dy-o. 


cprriomzze 


Slim pianti 
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Si osservi, per concludere, come spesso le distribuzioni vengono presentate 
(Schwartz, al quale anzi va attribuita la paternità del concetto) come funzionali 
lineari continui sullo spazio D (0) delle funzioni indefinitamente differenziabili 
a supporto compatto contenuto in (2. Si può mostrare come anche in tal caso 
si possa estendere la nozione di derivata e come le due definizioni di distribu- 
zione e di derivate distribuzionali coincidano [cfr. ad esempio Lusternik e So- 
bolev 1961]. 


2.5. Equazioni di evoluzione. 


Si è accennato nell’introduzione al legame che intercede tra la formula- 
zione di un problema fisico mediante equazioni differenziali e il determinismo. 
Si vuol ora mostrare come un corollario di questo principio, il principio di 
Huygens, sia legato all'esistenza di certi gruppi (più esattamente semigruppi) 
di operazioni funzionali. 

L'origine di questi studi si può far risalire a Picard (1895), ma è sostanzial- 
mente a Hadamard [1924] che si deve il maggiore contributo. Hadamard 
definisce cosi il principio del determinismo: « Dallo stato dell'universo all’istante 
to si può dedurre lo stato ad un istante ulteriore #' ». Come corollario di que- 
sto principio Hadamard ricava: «Questa deduzione può operarsi mediante un 
qualsiasi istante f, tale che tg<#,<#', poiché lo stato in 4, permette di calcolare 
quello in #, e questo lo stato in #'», ossia il principio di Huygens. 

Ancora a Hadamard si deve l’osservazione del fatto che il principio stesso 
si riflette in un certo (semi)gruppo di trasformazioni associato con la soluzione 
del problema fisico considerato. Nel caso studiato da Hadamard originaria- 
mente, il problema di Cauchy per le equazioni differenziali di tipo iperbolico, 
poiché i fenomeni sono reversibili, si ottiene in effetti un gruppo di trasforma- 
zioni. Nel caso irreversibile si associa invece in maniera naturale un semi- 
gruppo. Questo corrisponde al fatto che non si può dedurre in generale lo 
stato di un sistema fisico da quanto è accaduto in precedenza, 

Un esempio molto semplice. Conoscendo ad un certo istante le condizioni 
di riscaldamento di una stanza, posso dedurre l’evoluzione futura della tem- 
peratura. Se sono però in una stanza riscaldata uniformemente non posso cono- 
scere lo stato del termosifone in un tempo precedente. È estremamente in- 
tuitivo il fatto che numerose possibili evoluzioni della temperatura possono 
aver condotto allo stato attuale. 

La trattazione matematica del problema può essere affrontata con l’esem- 
pio seguente, ampiamente esplicativo: si consideri l'equazione del calore per 
una sbarra infinita 


du è’u 
di òx 
congiuntamente alla condizione iniziale u(x, 0)=f(x), ove si suppone che 


f(x) appartenga allo spazio delle funzioni limitate, uniformemente continue 
a valore reale. Questo spazio sarà indicato con X. Una soluzione w(x, t) della 


o <X< 0, 2>O 


i 
1 
1 
' 
i 
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equazione data sia u(x, #; f), per mettere in evidenza la dipendenza dalla fun- 
zione f. Si supporrà ancora — è essenziale — che esista un’unica soluzione, per 
la quale essa stessa e le derivate richieste stiano in X per ogni #>o, e che si 


abbia ancora 
lim u(x, t;f)=f(£). 
f>0+t 


Il principio di Huygens formulato in questo caso diviene: «Se la temperatura 
u(x, t) è determinata in modo unico al tempo #>o dalla distribuzione iniziale 
f(x), allora (x, #) può anche essere ottenuta calcolando la temperatura stessa 
ad un istante intermedio fg). 

La formulazione matematica diviene allora: 


u(x, t;f)=u(x, tto u(*, t05f)) 


Per ogni t>o, u(x, t;f) può essere considerata una trasformazione effettuata 
sulla funzione f; per mettere in evidenza questo fatto si scrive 


u(x, 1; f)=[WOf](). 


La trasformazione W(t) è lineare, a causa della linearità del problema. Si ha 


cioè 
WA (f+e)= WAf+ We. 
La proprietà espressa dal principio di Huygens diviene ora 
W(t+t,)f=WUW @)f1: 


Questo fatto si esprime dicendo che W(t) ha la proprietà di semigruppo. La 
condizione iniziale viene poi riformulata con 


lim |WOf-Sl=0 


ove 


f=sup|f(®)]- 
xeR 


La proprietà isolata in modo enfatico per W(t) mostra in modo molto 
caratteristico quale sia il tipico procedimento matematico. Mentre ci si sarebbe 
potuti accontentare dell'equazione du/òt= d?u/dx? e delle proprietà osservate 
— e questo non sarebbe né limitativo né sbagliato: si tratterebbe solamente 
di operare all’interno di una data problematica —, il procedere matematico 
va oltre, cercando la ragione profonda, la «causa» delle cose. Cosa è realmente 
significativo nel fenomeno che stiamo esaminando? Cosa rimane quando si 
prescinde da ogni particolarità? Il concetto di semigruppo che è stato appena 
isolato; e questo dunque viene posto come centrale, a fondamento della teoria. 
Si osserverà come in tutto questo non vi sia assolutamente nulla che assomigli 
al dedurre a partire da certe premesse, cosa alla quale molti vorrebbero ridurre 
la matematica. Vi è invece una profonda interazione dialettica tra realtà, teoria, 
riflessione su di essa, nuovo confronto con la realtà... Insomma, la Dialettica 
nella sua più piena ed efficace espressione! 
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Si esaminerà ora la connessione tra il semigruppo di operatori {W(t); 
0<t< +0} e l'equazione data. A tal fine occorre introdurre il generatore 
infinitesimale 


U;=lim WAI 


t+0+ T 


f. 


Ora, disponendo di U, è possibile scrivere 


u( 1473) 859) pg POLPO of 
wa OT ay 


-|EO2c, t;f). 


T 


Se ora si considera il limite per t-+0+ si ottiene 
ò 
— u(x, t)= Uu(x, t), 
di 

il che mostra come sia 


da 


Le considerazioni che sono state sviluppate suggeriscono di porsi in un 
contesto più generale. Sia X un dato spazio di Banach. Sia {W(t); o<t< +00} 
un semigruppo di operatori lineari limitati su X; sia cioè W(1,+t%,)= 
=W(t,) W(t,), W(0)=I. Si supponga ancora che valga 


Wflim [WWf-f]=0, 


il che sarà espresso dicendo che vale la proprietà (05) su X. In queste ipotesi 
si può mostrare che il generatore infinitesimale U risulta essere un operatore 
chiuso con dominio D(U) denso in X. Si può ora formulare, seguendo Hille, 
il problema di Cauchy astratto: 


PROBLEMA, Dati uno spazio di Banach X e un operatore lineare U con 
dominio D(U) e codominio R(U) contenuti in X, ed assegnato un elemento 
fo€X, si tratta di trovare una funzione u(t)=u(t; fo), definita su [o, 0) con 
valori in X tali che 


1) u(#) è differenziabile con continuità su [o, co) nella data norma; 
n) u(t)eD(U) e u'(1)= Uu(t) per ogni #>0; 
II) si ha 
lim |u()-fyl=0. 
t30+ È 


Se U risulta essere il generatore infinitesimale di un semigruppo di operatori 
{W(t); o<t<c0} la funzione (#)=W(t) f è una soluzione del problema per 
ogni f. È possibile dimostrarne l’unicità. 
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È chiara di conseguenza l’importanza di decidere se dato un operatore 
lineare chiuso U esista un semigruppo W(t) che lo ammetta come generatore 
infinitesimale. Un risultato importantissimo in questo senso è il teorema di 
Hille-Yosida. Esso fa intervenire l’insieme risolvente 0 (U) di U, ossia l'insieme 
dei valori X per i quali l'operatore A7—U ha un inverso limitato con dominio 
denso in X. Utilizzando questi valori del parametro X il teorema può enun- 
ciarsi: 

TEOREMA. Se U è un operatore lineare chiuso da. X în sé con dominio denso 
e se (MU)! esiste per ogni X>o con |(MI1-U)||<1/A, allora U è il generatore 
infinitesimale di un semigruppo di operatori {W(t); oÈt< co} di classe (€) su 
X tale che |W(t)|<1 per ogni t=o. Inoltre il semigruppo {W(t); o<t< 00} 


è unico. 


Per concludere, si accennerà ai legami tra quanto è stato esposto e la tra- 
sformata di Laplace. Si consideri l'equazione u'(t)= Au(t), u(0)=f. Appli- 
cando la trasformata di Laplace, si ottiene: 


+ + + 
| em?! u' (1) dt -[ e P'Au(t) dit= 4( e-P! u(t) di= 
0 o 


-2(" e?! u(t) di—u(0). 


Posto U(p)= fe?! u(t) di, si ha pU(p)--f= AU(p), cioè (A-p1)U(p)= 
=—f, il che mostra come possa ricavarsi U(9) e quindi, applicando la trasfor- 
mata inversa, (?). Tra l’altro l’ultima formula trovata giustifica la presenza 
dell'operatore A/—U nel teorema di Hille-Yosida. 


3. Calcolo delle variazioni. 


3.1. La brachistocrona. 


Il problema della brachistocrona viene trattato nei particolari sia per fornire 
una conveniente introduzione al calcolo delle variazioni, sia per mostrare, su 
un importante esempio, quale fosse il modo di procedere di un matematico 
della fine del secolo xvi. Si avrà cosf modo di osservare come l’analisi e la 
soluzione del problema condotte da Giovanni Bernoulli siano assolutamente 
«moderne»; dimostrando cosi la sostanziale unità che intercorre tra il calcolo 
differenziale dell’epoca di Bernoulli e quello attuale. Unità che spesso viene 
a cadere quando si contrappone la: matematica moderna a quella precedente 
fondandosi in gran parte sul fatto che il linguaggio della matematica attuale 
è molto più formale e rigoroso. 

S'immagini che A e B siano due punti dello spazio di differente quota 
(fig. 8). Il problema della brachistocrona è di decidere quale, fra le possibili 


813 Differenziale 


curve, debba seguire un grave che scivoli senza attrito in modo che il tempo 
impiegato per la discesa sia minimo. Il problema, per quanto, a prima vista, 
la cosa paresse strana, fu collegato da Bernoulli a un problema di ottica. Sup- 
ponendo che A e B siano collocati in mezzi differenti, in modo che la luce 
percorra il mezzo ove si trova A con velocità v, e quello ove si trova B con 
velocità v,, il tempo necessario per andare da A a B (fig. 9) è dato da 


VE 


Vi (2) 


T= 


Se s'immagina che la luce segua il percorso nel minimo tempo possibile, si 
ricava l’uguaglianza 
c_x 


x 
viVa?+x®  vyV b°+(c-x)? 


la quale comporta 
sina sin 


Di U, | 
S'immagini ora che il raggio luminoso debba attraversare un percorso strati- 
ficato, come nella figura ro. Si ha allora 
sina, sino, sinag sina, 


vi Va vs Va 
Se s'immagina ora di avere numerosi strati via via più sottili e numerosi, 
passando al limite si avrà 
sin a 


= Cost. 


Considerando ora nuovamente il problema della brachistocrona e scegliendo 
il riferimento come nella figura 11, se s'immagina che il corpo nello scivolare 
da A verso B sia in grado (come il raggio di luce) di scegliere il percorso in 
modo da minimizzare il tempo, si avrà ancora sina /v= cost. Per il principio 
di conservazione dell’energia, la velocità raggiunta dal grave a un dato livello 
è data dalla perdita di energia potenziale, si ha cioè v= V 2gy. Poiché sina = 
=1/V1+(y')?, si ottiene l'equazione differenziale y [1+( y')}]=cost che è la 
soluzione del problema. Come si è già osservato nel paragrafo sulle equazioni 
differenziali, la curva-soluzione risulta essere una cicloide. 

Si osserverà come quest’equazione differenziale sia stata ottenuta consi- 
derando il problema nella sua specificità, osservando cioè come dovesse risul- 
tare, per la curva-soluzione, sina /v=cost. Ma immaginando, in una fase 
precedente, di ricercare la soluzione tra varie possibili, allora si tratta di decidere 
quale curva y(x) faccia assumere valore minimo all’integrale 


"V+OP 


= dx, 
o V2gy 
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NS B 
Figura 8. 


Ancora il problema della brachistocrona. 


4 


| Figura 9. Ne 
| Il problema della brachistocrona: vale l'analogo della legge di rifrazione. 


Î A 


B 
Figura 10. 
L’idea «ottica» di Bernoulli per risolvere il problema della brachistocrona. 


Figura 11. n su 
Dalla spezzata della figura 10 si ottiene, passando al limite, la curva in figura. 
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il quale esprime il tempo necessario per andare da A a B. Cost il problema può 
formularsi astrattamente nel modo seguente: dato il funzionale DF(x, yy) dx 
ove F è supposta continua insieme alle sue derivate fino al secondo ordine in 


- un certo dominio B del piano (x, y) e per ogni valore di y/, si tratta di deter- 


minare una funzione y (x) in modo che esso assuma il valore minimo. È natural- 
mente lo stesso problema chiedere che tale funzionale assuma un valore mas- 
simo. 

Come nel caso delle funzioni di variabile reale, è poi naturale considerare non 
tanto massimi e minimi assoluti, quanto relativi. Si è cosi giunti a formulare 
uno dei problemi centrali del calcolo delle variazioni. Ecco la definizione che 
ne dà Lagrange [1760-61, ed. 1867 p. 335]: «Per poco che si sappia dei principî 
del Calcolo differenziale, si conosce il metodo di determinare le ordinate più 
grandi e le minime delle curve; ma vi sono delle questioni di massimo e minimo 
di genere più elevato e che, sebbene dipendenti dallo stesso metodo, non si 
trattano con la stessa facilità. Sono quelle in cui si tratta di trovare le curve 
stesse nelle quali una data espressione integrale sia massima o minima in rap- 
porto a tutte le altre curve». Oggetto del calcolo delle variazioni è quindi 
determinare i valori estremanti di un dato funzionale. Nel caso più semplice, 
tale funzionale è quello considerato in precedenza, ma è chiaro come il pro- 
blema possa formularsi in maniera assai più astratta per un certo funzionale 
L(y(x)), qualsiasi. 


3.2. L’equazione di Eulero, il lemma fondamentale. 


Si consideri dunque il funzionale SELF (x, y, 9') dx in cui F è una funzione 
come specificato in precedenza. Ci si propone di trovare una funzione ya) 
la quale faccia assumere a questo funzionale un valore estremante. Si vuole 
dedurre una condizione necessaria che y(x) deve soddisfare affinché il fun- 
zionale abbia in y(x) un tale valore. Si consideri una funzione n(x), la quale si 
annulli negli estremi dell’intervallo d’integrazione e, considerato un parametro 
numerico « (da pensarsi intuitivamente come molto piccolo), si consideri la 
nuova funzione y(x)+an (x). L’idea che guida questa considerazione è quella 
di variare di poco la funzione y(x), e di considerare conseguentemente il com- 
portamento del funzionale, come si fa nel caso ordinario delle funzioni reali 


- di variabile reale. Sostituendo al posto di y(x), la funzione y(a)+an(x) si 


ottiene: 
Ya= J ‘F(%,y+an (2), 9 (4) +an/(1)) de. 


Poiché y(x) deve corrispondere ad un valore estremante, la funzione Fa) 
deve avere un estremo per a=o0, e dunque la sua derivata deve annullarsi 
per «=o. Differenziando sotto il segno d’integrale si ottiene: 


MORI] TE,(8,9,Y)M@+F;/ (0,97) a] da. 


| 
I 
(I) 
| 
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Integrando per parti, si può ora scrivere 


7 )= [Fyn z+ Î n) [rs F| de 


Lo 


x: 


e, tenendo conto del fatto che n (xo)=n(x,)=0, si ha infine 
Zi d 
3 (0) -[ n(x) [i Fy|dx. 
%o 
Come si è osservato, dev'essere 7'(0)=o e perciò 
QI d 
Î n(x) [i F,|dx=o. 
%o 


Questa uguaglianza deve valere per ogni funzione ed è dunque naturale im- 
maginare come essa implichi 


d 
Fri F,y=0. 


Per dimostrarlo rigorosamente occorre però il seguente: 


LEMMA FONDAMENTALE. Se l'integrale {2 f(x)n (x) dx in cui f(x) è una fun- 
zione continua, si annulla per tutte le funzioni n(x) che si annullano inxeinx, 
e che ammettono una derivata continua în (x), x;), allora sì ha f(x)=o0. 


Tornando dunque a considerare l'uguaglianza 


I d 
Î n(x) [i Fy|de=o 


%o 
poiché con le ipotesi poste su Y la funzione 


ri rF, 


vd! 
è continua, si ha infine l'equazione di Eulero: 


d 
F Yy << F, y' o. 
Va osservato che le ipotesi poste, molto restrittive poiché si è utilizzata l’esi- 
stenza di y”(x), possono essere molto indebolite. Va tuttavia oltre gli scopi del 
presente articolo addentrarsi in tali questioni. , AT 

L'equazione di Eulero può essere sviluppata conducendo all’equazione de 
secondo ordine ) 

Li I 
Fyy 9 +F,y 9 +F,y-F,=0. 
Queste considerazioni possono generalizzarsi al caso di funzionali che 
: sa ; BIORETO 

dipendano da più funzioni, come {Z1F(x, y, y/, 2, 2") dx o a funzionali in cui 


sp nina tn 
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compaiono derivate di ordine più elevato, come SEP (x, VV, 9", 0) da. 
A parte le maggiori complicazioni formali, l'equazione di Eulero può essere 
ricavata nuovamente con la stessa tecnica. Va segnalato invece in modo esplicito 
il caso dell’equazione di Eulero negli integrali doppi. 

Si consideri l'integrale doppio 


(1) [[r6. y, 4, U,, Uy) dx dy 


e ci si proponga di trovare una funzione u(x, y) che sia continua con le sue 
derivate fino al secondo ordine in un dominio B, abbia un assegnato valore 
sul contorno / del dominio e dia valore estremante al funzionale (1). Con un 
ragionamento analogo a quello con cui è stata ottenuta l'equazione di Eulero, 
e applicando il lemma fondamentale opportunamente adattato al caso che si 
considera, si ottiene l'equazione di Eulero 

ò ò 


spinto 
oe E o 


che può scriversi, esplicitando, 


Fuzuztaz+ 2Fuzu'zyt+F, yi yy + Fuga + Fu atty + Fry = 


F,,=0 


F,=0. 


Le equazioni trovate sono, naturalmente, solo delle condizioni necessarie 
affinché una funzione y(x) o una funzione u(x, y) sia estremante. Sono di 
natura analoga alla condizione per una funzione reale di variabile reale dotata 
di un valore estremante in x, ed ivi derivabile che si esprime con f'(x)=0. 
Come questa condizione esse non sono in generale sufficienti. Questo risultato 
fu ottenuto assai presto, dei controesempi furono forniti da Legendre. Il 
problema della ricerca di condizioni sufficienti è assai arduo. Una prima solu- 
zione fu data dallo stesso Legendre e successivamente migliorata da Jacobi, 
ma essa non resistette alla critica che ne fece Weierstrass. Il criticismo di 
Weierstrass mise in luce la vera difficoltà del problema, cioè come una curva 
«vicinissima ad un’altra) potesse tuttavia provocare notevoli variazioni nel- 
l’integrale. 

Verso la fine dell’Ottocento si sviluppò una notevole revisione critica del 
calcolo delle variazioni (come del resto di tutta l’analisi) e si evidenziarono 
nuove vie per affrontarne i problemi. L’approccio moderno è caratterizzato 
sostanzialmente dall’uso di metodi diretti. 

Si osserverà come l'equazione di Eulero non affronti direttamente il pro- 
blema della ricerca di una curva estremante ma piuttosto come «scarichi» 
questo problema in uno di equazioni differenziali. Qui si espliciterà invece 
brevemente quale sia l’idea informatrice del cosiddetto metodo diretto. Ad 
esso sono legati, tra gli altri, i nomi di Ritz, Galerkin e Tonelli. Si suppone 
assegnato un funzionale 7(y(x)) definito sopra una certa classe C di funzioni. 
Al variare di y in C' si avrà una certa classe di numeri la quale sarà dotata di 
un estremo inferiore d. Può darsi che non vi sia alcuna funzione in C che 
realizza il valore d, ma tuttavia per la definizione stessa di estremo inferiore è 


ll 
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possibile trovare una successione y, tale che 7(yn) abbia come limite d al cre- 
scere di n. Una tale successione viene detta successione minimale. Il successo 
del metodo si fonderà ora sulla possibilità di trovare una successione minimale 
tale che passando al limite si ottenga la soluzione richiesta. Questo è il fonda- 
mento del metodo di Ritz, applicato successivamente da Galerkin anche in 
situazioni diverse da quelle del calcolo delle variazioni (1908, 1915). Si deve 
poi a Tonelli l’aver messo in luce il ruolo fondamentale della semicontinuità 
dell’integrale che si considera per il successo dei metodi diretti. 


3.3. Equazioni di Lagrange e di Hamilton. 


Le equazioni di movimento di Lagrange furono ottenute esprimendo in 
forma concreta il principio di minima azione, all’interno del calcolo delle 
variazioni. Egli espresse il principio dicendo che il prodotto della massa, della 
velocità e della distanza prese tra due punti fissi debbono essere massimi o 
minimi. Si tratta in altre parole di considerare i valori estremanti dell’integrale 
Smv ds oppure, osservando come ds=v dt, dell’integrale [mw? dî. 

Per ricavare da queste considerazioni le equazioni di movimento, Lagrange 
introdusse le coordinate generalizzate. Per spiegare cosa siano le coordinate 
generalizzate di un sistema meccanico, si considera l’esempio semplice di una 
particella nello spazio. La sua posizione può essere espressa utilizzando le 
coordinate rettangolari, come nella figura 124. Tuttavia, può essere più con- 
veniente esprimere la sua posizione mediante le coordinate cilindriche, ossia 
come nella figura 128), o anche mediante un qualunque altro sistema di coor- 
dinate. Cosi è possibile associare alla particella tre numeri i quali ne esprimano 
la posizione secondo certe convenzioni fissate. Se ad esempio, invece, si con- 
sidera una sbarra rigida mobile nel piano, la si può pensare formata da due 
particelle rigidamente connesse A, B, come nella figura 134, con le coordinate 
che esprimono la posizione di A in riferimento cartesiano € l’angolo che la 
sbarra forma rispetto a uno degli assi (fig. 135). In generale, dato un sistema 
meccanico, ad esso si associeranno n coordinate generalizzate. 

Gli elementi meccanici considerati da Lagrange per ricavare le sue equa- 
zioni, sono ora: 


Figura 12. 
Coordinate del punto P: cartesiane in a), cilindriche in 2). 


generali (5). 
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1) l'energia cinetica T. Nel caso di una singola particella questa è espressa 
se la particella è rappresentata con le coordinate cartesiane x Y, 8 da 
T=(4°+y?+2)/2. Per n particelle indipendenti, l’energia cinetica sarà 
la somma delle energie cinetiche. Per un sistema meccanico più com- 
plesso essa sarà calcolabile ancora in termini delle coordinate 
e delle relative derivate gi, 4), ..., Gn; ca 


2) l'energia potenziale V/( * cri 
: di» Ig: +») Gp) Mediante le cui derivate si 
esprimere le forze agenti, Di 1 possono 


Ni : i 
s Lao ulteriore posta da Lagrange è che T+V= cost. L’azione lagrangiana 
a considerarsi è ora Sz17 di. Imponendo che questo funzionale abbia la prima 
variazione nulla, si ottengono infine le equazioni 


a 
di\dg} dg da, ° 


Si ha dunque un sistema di n equazioni differenziali del secondo ordine che 
descrive il movimento del sistema. Le coordinate Q; possono non avere, com 
sl è osservato, un significato fisico o geometrico immediato. Oggi si arla di 
esse come di coordinate nello spazio delle configurazioni. Le ataa (£ 
descrivono in questo spazio una certa curva. su 
Le equazioni di Lagrange sono dedotte all’interno della dinamica newtoniana 
e in effetti sono equivalenti alle equazioni che si ottengono dalla seconda legge 
della dinamica di Newton. Hanno però rispetto alla formulazione di Ni 
numerosi vantaggi. Intanto sono formulabili in un qualsiasi sistema di coor- 
dinate e sono invarianti in forma rispetto ai cambiamenti di coordinate. So 
oo però hanno il vantaggio di essere ottenute a partire da un i 
pi n orniscono dunque un aspetto unitario alla trattazione dei fenomeni 
E ora le equazioni di Hamilton. Come si è già osservato all’inizio del para 
grafo, anche se dal punto di vista formale non vi è una grande dini na 


i due punti di vista, vi è però una di î Si 
sofico. ’ P differenza sostanziale dal punto di vista filo- 


a) 
Q 
I 5) 
Figura 13. 


Sbarra idealizzata con due particelle A, B connesse rigidamente (a) e sue coordinate 


il; ; 
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; , ‘ncini jazi iflette una necessità co- 
Infatti per Hamilton un principio variazionale non rifle € j : E 
î smologica, Lu modo comodo per raggruppare unitariamente molti fenomeni. 4. Forme differenziali. 
ill azi i a Hamilton è 3 
il L’azione considerata d co) 4-1. Teoria locale, 
i FER4:1 
lil . . &: . . . . . 
Il S -[ (T_V) dt, Si considererà dapprima il caso degli aperti di R®, Nel paragrafo succes- 
Î L sli: int ch b ie e sivo si estenderanno le considerazioni al caso delle varietà differenziabili (per 
il ove però si consente di paragonare cammini che non hanno Il -rione P cui si veda l'articolo «curve/superfici» della presente Enciclopedia). Sia E uno 
i eccetto quella che il moto lungo di essi inizia all'istante 1, nella foi spazio vettoriale di dimensione 7, e si consideri accanto ad esso la sua « algebra 
il e termina nel punto P, all’istante ty. Il principio di Hamilton consiste 5 ca esterna» AE, costruita come somma diretta delle potenze esterne p-esime 
ili mare che il moto attuale è quello che rende l’azione stazionaria. Ponendo i AE. In altre parole, si ponga 
i L=T_-V e considerando la prima variazione, si ottengono cosi le equazioni ci 
Îl = È 
Î dL d(dL\_ AE AE. 
il dg, di\dg Cr saba inez ts 
ii T se ba La potenza esterna p-esima è costruita introducendo n simboli Cis Coast, 
" Queste, nel caso che, come nell’ipotesi di Lagrange, sia T4+V= cost, si ridu- 
| » 


preda 1 e un'operazione di prodotto esterno A per la quale si richiedono le proprietà 
io cono alle equazioni di Lagrange, ma possono formularsi, più in generale, 


ù Dee: I AE; =0 
Il anche per sistemi non-conservativi. , ina (1) GA; 
Alle equazioni di Hamilton si può dare anche un’altra forma molto in- E,nE;= —E,aE, 
teressante. Posto infatti dL (E AG )Atz= EA(E;AEx). 
2 i dg; Accanto ai simboli Eito, vo En si considerano poi i monomi del tipo E AA 
dell ioni denti e le espressioni con coefficienti in £ della forma 
tenendo conto delle equazioni prece 
. ÒdL Vario 
Pi dg; Per queste espressioni si pongono poi delle regole di calcolo per la somma e 
Se ora si considera la funzione il prodotto, comportandosi sostanzialmente come se si avesse a che fare con 
H(p;, 91) = —L+)Y bid polinomi nelle indeterminate En» Non En, ma badando naturalmente a rispettare 
: . RE le proprietà (1). Un esempio chiarirà completamente questo modo di procedere. 
cioè, dal punto di vista fisico, l'energia totale, si ottiene il sistema 
dH (ab +0Ea+cE3)A(dE+et,)= ad &mE+bd Ent, +cd Ent, + 
LT dp; +ae ENE3 + de EE +ce Ent, = 
dH =(-bd+ ae) EE, +cd Ent, +ce Ent = 
b;= — 3g; = (ae—bd) E At, —cd E,nEa—ce Eahbg 
il i 
| il quale, considerato successivamente da Jacobi, fu denominato sistema dif- Sì osserva, nel procedimento, come in accordo con le (1) il termine ad E, NE, 
il A canonico. Si può mostrare come questo sistema sia ottenibile, ancora sia stato posto uguale a zero e come si siano raggruppati i due termini dd É,AÉ,, 
il 7 î iazionale, considerando l’integrale ae E,nÉ, aventi lo stesso monomio (naturalmente per fare questo calcolo ab- 
| POE ; biamo assunte implicitamente molte regole, quali (24) o=o0, ecc. Queste regole 
| S= (Vpidi—H) dio sono molto semplici e corrispondono perfettamente all’intuizione che uno si 
| s5 fa del calcolo [per una trattazione formale molto rigorosa cfr. Schwartz 1967]. 
ti math Na rsa ; SI Si Ta Riga 
su Il lavoro di Hamilton, e quello successivo di Jacobi intorno alla risolvibilità Si consideri ora un aperto Q di R ha lo spazio e (0) delle funzioni f :0>R 
| j lto importanti sia intrinsecamente, sia perché segnarono che siano indefinitamente differenziabili. È ora possibile costruire l’algebra ester- 
I o) È - 5 VIRA ; 5 ; 
| E cu di altre formulazioni variazionali nell’ambito di altre na di questo spazio. Per rendere più intuitivo lo sviluppo di quanto segue è op- 
Il a fisiche come l’elettromagnetismo e la teoria dei quanti. portuno usare invece dei simboli &,, È», ..., €, i simboli dx, ..., den (questa 
i 
di 
ili 
t 
ti E» 
SITI 
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notazione fa naturalmente pensare a dei differenziali e questa è la ragione di 
tale nomenclatura. Bisogna però essere molto attenti, per evitare fraintendi- 
menti, a quando è lecito pensare i simboli dx,, dxs, ..., dx,, come differenziali 
e quando no [cfr. ibid., p. 42]; la situazione è simile a quando si indica un 
integrale indefinito (nell’analisi elementare) con | f(x) dx. Naturalmente il sim- 
bolo dx potrebbe essere omesso e potremmo scrivere | f(x). Però esso è certa- 
mente molto utile, se non altro per ricordare come si deve procedere quan- 
do si tenti di trovare una forma esplicita dell’integrale, operando delle sostitu- 
zioni di variabili). 

Si indichino con $°(0), 8(0), ..., €(0) gli spazi vettoriali delle forme 
di grado o, I, ..., x, rispettivamente, identificando $°(0) con €©2(0). Si ha 
naturalmente che ©%+1(0)=0, poiché necessariamente in una forma di grado 
n+1 vi dev'essere un dx; ripetuto. Lo spazio vettoriale &2(0Q) ha l’ulteriore 


struttura di ©(0) modulo. Come tale è un modulo di rango n) Anco- 
ra, si ponga P 


80)= E 0). 
P=0 


È ancora utile osservare che, date x, € &2 (0), B,e 690), allora ap1Bz€ $7+2(0) 
e cph1Bg=(-1)PAcp È ora possibile definire un'operazione di differenziale 
esterno d? : &2(0)+ &P+1(0) (quando non vi sarà luogo a fraintendimenti si 
ometterà l'apice p, d : &2(0)+ 82+1(0)). Quest’operazione può essere definita 
prima sulle forme monomie; se w? è del tipo w?=a(x)dx;,\...Adx;,, allora 
si pone 


du? = da (x)Adx, A.Adxi, E > 


da (x) 

dx;\dx;,A...\d&; 

i 
Per una forma qualsiasi si estende per linearità la definizione. In particolare, per 
una forma di grado zero, cioè per una funzione, il differenziale esterno viene 
a coincidere con il differenziale ordinario. La più importante proprietà del 
differenziale esterno è data dal seguente 

TEOREMA. Siano 

de: EP (0) EP (0) 
dP : €&2(0)> 82440) 


allora dro d?-1=o0, 


Dimostrazione: Basta osservare come questa proprietà sia vera per le forme 
monomie. Si ha infatti: 


da da 
ddu? =d (x dip pn.) = E dx, dx; dxx\dx;Adx; \..Adx;p =o0 
poiché 
da _ d°a 
Òxz dae; dx; dar 


dii e ci i e, 
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Poiché una forma qualsiasi è formata dalla somma di forme monomie, ne 
segue la tesi. 

Questo teorema ci permette di costruire la successione di moduli e di 
omomorfismi: 


0+ 8° (0) 5 81(0) 4 82(0)+...+ &2(0)>0 


la quale è una successione nulla, cioè componendo due omomorfismi successivi 
si ottiene il morfismo nullo. Ora, il fatto che d20d?-1=o significa che se si 
considerano i due sottomoduli di &2(0) dati dal «nucleo» di d? (Ker d?) 
e dall’«immagine» di d?-! (Im d2-4) così definiti: 


Ker dP= {xe &9(0): dP(x)=0 in &241(0)} 
Im dP1= {ye $2(0): esiste un a'e 82-1(0) con d2-1(x°)=y} 


si ha Im d?P-1< Ker d?. Questo autorizza a considerare 


Ker d? 
Im d?-1 


H?(Q)= 


il p-esimo gruppo di coomologia di De Rham. 

In termini intuitivi, si può dire che il p-esimo gruppo di coomologia di 
De Rham misura la differenza tra il nucleo dell’omomorfismo d? e l’immagine 
dell’omomorfismo d?-!. In genere si usa chiamare chiuse le p-forme w? per le 
quali d? (w?)=0, mentre si dicono esatte le forme di grado che sono ottenute 
da quelle di grado p—1 applicando d?-, Il teorema precedente si può rienun- 
ciare dicendo che ogni forma esatta è chiusa. Il p-esimo gruppo di coomologia 
misura dunque quante sono le forme chiuse che non sono esatte. 

Prima di procedere è bene studiare qualche esempio, considerando per 
semplicità 0 =R?. Si consideri una forma #° di grado 0; essa è semplicemen- 
te una funzione di tre variabili f(x, y, 2). In tal caso si ha dw®=df= grad f. 

Si consideri ora una forma differenziale di grado 1; essa può scriversi 
w=adx+bdy+cdz e si ha in tal caso: 


da da da db db db 
dul= d - dv 
w (È 8A + 3I de) (Po det 94 de) + 
Òc dc de 
dg = d 3 
+(£ +5 dy+ 3 de) ada 


da db db de da de 
={-—+—|]dxnd ——+— —+— 
( yi SÌ xNdy + ( > + 55) dyndz + ( 3 + 5) nda 


e le quantità che compaiono a coefficiente di dx\dy, dydz, dxndz sono le com- 
ponenti del rotore del vettore v=(a, b, c). 
Considerando invece w°=ady1dz+8dzndx+ydxndy, si ha 


da dB ò 
du? = (i 33) dxndyndz 
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i cioè, considerando il vettore v= (a, B, y), il coefficiente di dw? è la divergenza 


num ile, è i ; , iu 
il dvd) erabile, è pensabile localmente come lo spazio euclideo R®. Più esatta- 


mente, per ogni punto f di X sono assegnati un aperto U, € un omeomorfismo 


Con l’operazione di differenziazione esterna, si ottengono dunque gli ope- ; no; ; i 
P , 8 que gli op @, : U,->+R", in modo che Pa (P)=(x%, X$, «.., 4%) può essere immaginata come 
re tuttavia che P.appartenga anche 


I ratori gradiente, rotore, divergenza della fisica matematica. Questo permette una n-upla di coordinate di p. Può succed 
. . i s è #,,° . ede 
d’intuire come vi possa essere un profondo legame tra i fenomeni descritti a un altro aperto U.. i FASE : 
p Pa in modo che a p si possano anche assegnare le coordinate 
..., «P), Occorre naturalmente che questi due sistemi di coor- 


| dalla fisica matematica e le forme differenziali. Poiché, come si vedrà, le forme i op(p)=(x8, at 
differenziali sono profondamente connesse alla topologia algebrica, si capisce dinate siano ompanbili: in altre parole che @,0 ©g!, che dà il passaggio dal 
; io dal- 
l’uno all’altro sistema, sia un ©.isomorfismo. - » sù 


come si possa portare avanti la tesi di un’unità profonda tra la topologia alge- ; 
In generale, si chiederà dunque che se U, e Ug sono due aperti con inter- 


brica e la fisica matematica [cfr. Tonti 1972]. 
Un importante risultato di Poincaré chiarisce, in un caso importante, il i i i j ; ; 
p i : p ’ sezione non vuota, si abbia, nella situazione illustrata dalla figura 14, che 
I rapporto tra forme chiuse e forme esatte. È o 071 sia Cei fi - LL : . 4, Che 
| ; n° E un l°-isomorfismo. Poiché per ogni p sono assegnati un aperto 
LEMMA (Poincaré). Sia OQCR? convesso e connesso. Allora ogni forma chiusa U., e un omeomorfismo ©, : U,+R”, si ha che gli aperti U, sono un ricopri 
» Y È. i i joè i 0 ì 
do cava nn ; mento di X, cioè UU,=X. Gli omeomorfismi Pa permettono di pensare su 
U, la struttura di R*: le funzioni differenziabili, i vettori tangenti, le forme 
differenziali, ecc. Se UM Ug# Z su U,0U agiscono però sia 9, che ®g € 
Sì hanno dunque due modi di trasportare la struttura di R?, ‘Tuttavia, la ri- 
chiesta che Pa ° gi sia un @*-isomorfismo fa si che questi modi siano com- 


| ae 


Di questo teorema si può dare una seconda forma, più «algebrica». Ogni 
il numero reale può essere considerato come una particolare funzione, la funzione 
costante, che assume sempre il valore indicato dal numero. È allora possibi- 
le considerare l’inclusione RC $°(0) e conseguentemente il complesso «au- 


TT 


i an patibili. Per riassumere la situazione si ha dunque sulla varietà X localmente 
" cioè su ogni apert i sioni di RR, 
i o+R+8%(Q)+81(0)+...+ &2(0Q)+o. E alobale. gni aperto U,, la struttura di R" e delle condizioni di compatibilità 
vl Allora si può enunciare la seconda forma del lemma: Queste strutture definite localmente e compatibili globalmente possono 


ili essere analizzate più in dettaglio e il risultato dell’analisi è izi ; 
i "0 1 , va ALGI ell’analisi è la definizione di 
I LEMMA. Il complesso 0o+R-8%(02)+8!(0)>...>&(Q)-0 è esatto. fascio di funzioni, di forme differenziali, ... sulla varietà. Il concetto di fascio 

3’ 


RE Il significato di questo lemma può riesprimersi dicendo che in questo caso introdotto da Leray negli anni 1945-50 ed esposto per la prima volta appunto 
i tutti i gruppi di coomologia di De Rham sono uguali a zero. Questo risultato nei Seminaires Cartan del 1950, ha assunto nella matematica moderna un 
i suggerisce come vi debba essere un legame tra la coomologia di De Rham e ruolo centrale. Qui ci si limiterà ad accennare in che senso le forme differen- 
il la maggiore o minore semplicità dello spazio topologico (in questo caso 0) ziali costituiscono un fascio sulla varietà X. 

i ove vengono definite le forme differenziali. In effetti il teorema di De Rham Se U, è un aperto omeomorfo a R”, su U, si hanno le forme differenziali 
I che si vedrà nel paragrafo successivo sarà proprio un risultato in questo senso. &2(U,) di grado p, semplicemente trasportando le forme di R” di grado p; 
i A conclusione del paragrafo si osservi che le ipotesi nelle quali è stato enun- ancora esse formeranno un €*(U,)-modulo, ove si indicano con C°(U,) le 


funzioni di classe © 


il È > definite su U,. Se U è un aperto qualsiasi (non necessa- 
riamente del ricopri 


mento considerato) è chiaro come si possa considerare 


Il ciato il lemma sono certamente troppo forti. Tuttavia, il fatto che siano neces- 
ili sarie delle restrizioni è chiarito dal comportamento della forma differenziale 


dunque una varietà differenziabile X di classe © e di dimensione n. Ciò 


Rapa ; i È Figura 14. 
significa che X, che si suppone essere uno spazio topologico separato, a base 


| pp I® 
| Zpyi 
Il i x°+y 
è 4 . . N N Ua, Ug 
. definita su R°— {(0, 0)}. Questa forma differenziale è tale che dw=o0, e però 
I non esiste alcuna w' tale che du =. 
i ! | eri (UN Ug) ®g 
i 4.2. Forme differenziali su una varietà differenziabile. 
| 
i Si vedrà ora come la struttura delle forme differenziali fin qui considerate @z, fiagi Ag 
i su aperti di R” possa trasferirsi su una varietà differenziabile. Si consideri Pa(Ux 0 Ug) vi: og (U.0Ug) 
i 
| 


Cambiamento di carta su una varietà differenziabile. 
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&2(U), mediante le forme che definite localmente si possono estendere su 


tutto U. Ancora avremo che &2(U) è un €*(U)-modulo. Se si considerano . 


due aperti V, U con VCEU vi è un omomorfismo naturale SS 
, lea È . 
esso è dato dal «restringere» una forma definita su U a una definita su V. 
Si considera cioè la stessa forma ma definita semplicemente sull Di 
piccolo. Se si indica con « la forma considerata di 8P(U) il risultato della 
restrizione viene indicato con a|V. La legge che ad ogni aperto D i 
&?(U), le forme differenziali definite su U, e ad ogni inclusione VE U CIA 
morfismo di restrizione &(U)- &?(V) con aHa|]V ha le due proprietà: 
1)se V=U l’omomorfismo di restrizione è semplicemente l’identità 
anajV=a; -” 
2) se SL VCU è la stessa cosa effettuare la restrizione direttamente 
oppure in due passaggi: (a|V)]W=«|W. 
Tutto questo viene riassunto dicendo che UH &?(U ) costituisce un prefascio. 
Esso è in particolare un fascio, cioè verifica ulteriormente due condizioni: 


e {U;}, îeI è un ricoprimento di U, cioè UU;=U e se sono assegnati 
Ù . Li a, B di &?(U) tali che a|U; =BIÙ,; per ogni ? allora sin 8; 
4) se, ancora UU;=U ed è data una famiglia di elementi a;e &2(U;) 

compatibile, cioè tale che per ogni coppia di indici i,jdiIsiax|U,0U;= 

=«;]U;NU;, allora esiste un elemento a di &?(U) con a|U;=@a;. 


i nque il fascio delle forme differenziali di grado p sulla varietà 
X 5 i RR globalmente con &?; e s'indicherà il suo « valore» su i con 
&P(U) oppure con I'(U, 82). In particolare, le forme differenziali de n 
su tutta la varietà saranno denotate con I'(X, è?) (non è detto però che de 5 
bano esistere sulla varietà forme differenziali globali diverse da quella con i 


coefficienti identicamente nulli). Isera l 
Il modo stesso con il quale sono state introdotte le definizioni di prefascio 


e di fascio suggerisce la maniera per estendere sulla varietà Ke cose viste 
i Î i il di i sterno 
localmente. In particolare, su ogni U, abbiamo il differenziale e 


dy,: &(U2) + &P41(U,) 
e questo può estendersi ad ogni U, in un omomorfismo 
dy : &P(U)> &PH1(U). 
Si verifica facilmente che, se VCU si ha il diagramma commutativo 


RDS 804 ©, 
IV 
8P(V)_>8P4(7) 


è SC 1 
cioè un «omomorfismo globale» d : è? + è241, pa NE 
Per questo omomorfismo si ha ancora d o d=0 (il che significa che localmente 


mi I ie 


span 
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vale questa proprietà). Ne consegue che si può ancora considerare il complesso 
0+805 815.4 8150 


e introducendo ancora R, inteso però questa volta come le funzioni costanti 
sulla varietà, il complesso 


(1) csR5805g15 dgito 


Per ricavare ancora l’esattezza di questo complesso (l'esattezza localmente) 
occorre disporre nuovamente del lemma di Poincaré. Per questo occorre 
tuttavia fare delle ipotesi sulla struttura topologica di X. Infatti, la tecnica 
con la quale si dimostra il lemma di Poincaré richiede la possibilità di disporre 
dell’integrazione sulla varietà. Mediante un procedimento che coinvolge in 
maniera essenziale l’integrazione, si risale infatti, nel caso considerato in pre- 
cedenza, da una forma x ad una a’ tale che da/=. Il dispositivo tecnico 
mediante il quale si può effettuare l’integrazione sulla varietà è dato dalle 
partizioni della unità, o partizioni di Dieudonné, le quali appunto richiedo- 
no delle ipotesi sulla topologia di X. Per esempio si può supporre che X sia 
uno spazio topologico paracompatto. In tale ipotesi si può dimostrare come 
il complesso (1) sia esatto. Accanto al complesso (1) si può ora considerare il 
complesso delle sezioni globali 


o>T (Xx, R)+T(X, 8)>T(X, 81)>...+ TX, 8)-0 


che viene anche detto complesso di De Rham. È essenziale il fatto che questo 
complesso, in generale, non è più un complesso esatto. Questo fatto dà origine 
ad una coomologia, la coomologia di De Rham. Si può cioè considerare il f-esimo 
gruppo di coomologia di De Rham definito da 


Ker d : T(X, &)>T(X, 6241) 


Hbx(X)= Im d : rx, &2-1)>T(X, 9) 


In particolare X, essendo una varietà topologica paracompatta, ammetterà 
anche una coomologia a valori in un fascio e ancora più in particolare quindi 
una coomologia a coefficienti reali. Avremo quindi, per ogni p, il p-esimo 
gruppo di coomologia a valori reali H7?(X, R). Il risultato fondamentale che 
ora si è in grado d’enunciare è il seguente 


TEOREMA (De Rham). / gruppi di coomologia costruiti con le forme differen- 
ziabili HB (X) ed î gruppi di coomologia a coefficienti reali H?(X, R) sono 
isomorfi. 


Questo risultato, della massima importanza, ottenuto da De Rham intorno 
al 1930, mostra come la struttura differenziabile di X, mediante il calcolo dei 
gruppi di coomologia di De Rham, permetta di caratterizzare la struttura 
topologica; almeno quella parte della struttura topologica che è definibile in 
termini di coomologia. [m. G.]. 
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i asse di scienze fisiche matematiche naturali dell’Accademia dei Lincei» gennaio 
Tricomi, F. G. 


1961 Equazioni differenziali, Boringhieri, Torino. 


Equazioni differenziali ordinarie e alle derivate parziali sono presenti fin nei primi 
problemi del calcolo infinitesimale relativi al moto dei corpi materiali, degli bai (cfr 
astronomia, stabilità/instabilità), a fenomeni di propagazione (cfr. suono/rumore), 
quali il problema della corda vibrante. Quest'ultimo in particolare ha grande importan- 
za per lo sviluppo del concetto di funzione (cfr. funzioni). Anche i problemi relativi 
al calcolo delle variazioni (cfr. anche variazione e calcolo) si presentano con il sor * 
del calcolo stesso, legandosi spesso a concezioni generali del mondo (cfr loisigloni 
o a problematiche filosofiche generali (cfr. filosofia/filosofie). ne 

Con l'affermarsi dell’esigenza del rigore, i procedimenti differenziali divengono og- 
getto di una revisione critica che pone in luce l’importanza di concetti quali la i 
(cfr. continuo/discreto) e, parimenti, l’importanza dei teoremi d’esistenza, con la ne- 
cessaria attenzione al punto di vista locale/globale. Le forme diftorenziali. definite su 
curve, superfici (cfr. curve e superfici) o più in generale su varietà ect (cfr 
geometria/topologia), pongono in luce importanti legami tra l’analisi ed altri settori 
della matematica (cfr. anche invariante). I problemi all’origine del calcolo differenziale 
si collegano strettamente al concetto di approssimazione da un lato, e al problema t 
rico dell’infinito dall’altro. Nel considerare questi problemi va Hou » 


I i i con: a in evidenza l’es- 
senza dialettica dei cambiamenti dei punti di vista. 


Il 


414 


cui si 
ti 
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1. Il termine e le sue accezioni. 


Come spesso capita per i concetti utilizzati in vari campi di conoscenza, 
la nozione di funzione comprende accezioni più o meno generali o specifiche 
a seconda delle discipline che la usano. I significati più generali si riscontrano 
nelle scienze cosiddette esatte, soprattutto matematica, fisica e chimica, men- 
tre la biologia e le scienze umane e sociali aggiungono al senso generale certe 
sfumature che derivano chiaramente da caratteri specifici degli oggetti che esse 
studiano. Passando, ad esempio, dal mondo inanimato a-quello animato, si con- 
stata la progressiva introduzione di idee complementari che riguardano essen- 
zialmente la nozione di finalità, o addirittura quella di intenzionalità. Questo 
spostamento di senso, oppure, se si preferisce, il suo arricchimento grazie al- 
l’addizione di nuove specificità, può essere facilmente constatato, come si ve- 
drà ricapitolando ciò che la nozione di funzione rappresenta nelle diverse di- 
scipline. 

In matematica, il concetto è associato alle situazioni in cui una grandezza, 
chiamata appunto «funzione», è determinata dal valore assunto da un’altra 
grandezza chiamata «variabile». Si tratta perciò di una relazione di dipenden- 
za da parte di una grandezza nei confronti di un’altra, dipendenza che d’al- 
tronde si trasforma facilmente in interdipendenza grazie alla nozione di fun- 
zione inversa. Per generalizzazione, si passa in seguito alla nozione di funzione 
di più variabili, poi a quella di funzione multivoca, per giungere all’idea ge- 
nerale di corrispondenza, ovvero di variazione concomitante di diverse gran- 
dezze. La nozione matematica di funzione consente cosi di descrivere il ruolo 
di questa o quella variabile, in un insieme di variabili legate tra di loro nel 
modo che è appunto precisato dalla funzione stessa. 

Se si passa dalla matematica alle scienze della natura inanimata, il con- 
cetto di funzione rimane sostanzialmente inalterato. Per esempio, quando in 
chimica si parla della funzione acida o basica di un tipo di molecole, si tratta 
sempre di proprietà che queste molecole manifestano in un dato ambiente, 
cioè del ruolo che hanno nell’insieme che esse costituiscono unitamente a ciò 
che le circonda e che con esse interagisce. 

Nel passaggio alle scienze della natura animata appare uno spostamento di 
senso, 0, più esattamente, un’aggiunta semantica che si va precisando man 
mano che ci si sposta verso le discipline che hanno come oggetto gli organismi 
più evoluti e, soprattutto, nel caso delle relazioni fra tali organismi riuniti 
in società, La nozione di funzione tende, in questo caso, a non inglobare pit 
l’insieme delle proprietà manifestate dagli elementi considerati nell’ambiente 
in cui sono posti, bensi soltanto quelle che concorrono alla realizzazione di 
un dato obiettivo. Cosî, quando in biologia si parla della funzione fisiologica 
di un organo, se ne considerano soltanto le proprietà che gli consentono di 
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partecipare a certi aspetti, considerati essenziali, del funzionamento comples- 
sivo del sistema di cui è un costituente. Allo stesso modo, la funzione di un 
individuo in una società tiene conto soltanto del ruolo esercitato in vista della 
realizzazione di determinati obiettivi. Infine, per naturale estensione, l’uomo 
applica la stessa nozione agli oggetti che costruisce; per esempio, a proposito 
della funzione di un elemento di un meccanismo, oppure di questa o quella 
parte di un edificio in architettura. 

Si noterà subito che il secondo senso del termine ‘funzione’, che si po- 
trebbe definire come senso finalizzato, è in realtà una specificazione del primo 
senso, che è più generale e non fa astrazione a priori da nessuna proprietà, 
da nessuno dei ruoli principali o secondari che un elemento può manifestare 
nell’insieme di cui fa parte. Qualsiasi analisi della nozione di funzione implica 
perciò, in primo luogo, un esame dettagliato del suo significato più fondamen- 
tale, vale a dire di quello che appare in statu nascendi nelle procedure generali 
che si intraprendono per conoscere il mondo circostante; a questo esame sarà 


. consacrato essenzialmente questo articolo. 


È opportuno notare che lo studio delle funzioni finalizzate è impensabile 
se non si definisce in modo preciso la struttura del sistema inglobante, che 
condiziona gli stati verso i quali esso tende di conseguenza, cioè, ad essere 
precisi, la sua finalità. Per i sistemi molto complessi (biologici, ad esempio), 
oppure per quelli la cui lenta evoluzione è nota soltanto su lassi di tempo re- 
lativamente brevi (società umane, ad esempio), l'inventario esaustivo di tutti 
i fattori che intervengono in modo significativo nel loro comportamento è sem- 
pre un’operazione estremamente difficile e, in numerosi casi, probabilmente 
senza speranza allo stato attuale delle conoscenze. I tentativi che a questo 
scopo possono essere compiuti implicano spesso scelte più o meno arbitrarie, 
o addirittura giudizi di valore, che comportano seri dubbi sulla validità e obiet- 
tività delle conclusioni cui si giunge. Perciò, includere nell’analisi della no- 
zione generale di funzione certi aspetti che appartengono ai caratteri propri 
di questa o quella particolare funzione finalizzata sarebbe una fonte di con- 
fusione. Gli studi che si situano a questo livello non sono certo privi d’inte- 
resse, né d’importanza, ma trovano la loro vera collocazione solo quando si 
tenta d’applicare a sistemi particolari le considerazioni sviluppate a proposi- 
to della nozione generale di funzione. 

È evidente, tuttavia, che lo studio della nozione generale di funzione non 
implica l'eliminazione di tutto ciò che riguarda l'ambientazione degli oggetti 
considerati. Certi caratteri generali di questo ambiente, e comunque la sua 
esistenza, dovranno evidentemente essere conservati, dal momento che diven- 
terebbe impossibile parlare di funzione senza l’idea d’interazione. Saranno tra- 
scurati soltanto i caratteri specifici di particolari ambienti, in quanto non per- 
tinenti all’analisi. . 

Si noti infine, per concludere questa introduzione, e a titolo di semplice 
suggerimento, che un altro studio di carattere generale meriterebbe senz’al- 
tro di essere fatto, come prolungamento di quello che qui sarà compiuto a 
proposito della nozione di funzione. Bisognerebbe effettuare un'analisi con- 
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giunta dei concetti di causalità e di finalità, alla luce di quanto potrebbe veni- 
re loro dallo studio della nozione di funzione. Infatti, quanto si è appena detto 
sul ruolo della specificità dell'ambiente negli aspetti finalizzati del compor- 
tamento degli elementi, lascia intravvedere una nuova possibilità di affron- 
tare la famosa antinomia tra descrizione causale e descrizione finalistica dei 
fenomeni. Non è escluso che la necessità di ricorrere a spiegazioni finalistiche 
sia conseguenza nella maggior parte dei casi, dell’aver trascurato l’ambienta- 
zione dei sottosistemi studiati, e che una esplicitazione più completa o più 
adeguata dell'ambiente permetta di ritrovare l'ambito delle spiegazioni causali. 


2. Il problema della ricerca di funzioni elementari e della definizione di ca- 
ratteristiche intrinseche di elementi. 


La funzione di un qualsiasi oggetto o elemento è strettamente legata al 
comportamento di tale elemento e al ruolo che esso svolge in un ambiente 
dato, il quale è, a sua volta, costituito da vari elementi. La nozione di funzione 
è quindi inseparabile da quella d’interazione e, di conseguenza, anche da quel- 
la di sistema; la sua esplicitazione può essere fatta solo a patto che interven- 
gano, al tempo stesso, l’elemento considerato e gli altri elementi situati nel- 
l’ambiente. Come si è visto, parlare delle funzioni di un elemento non preci- 
sando affatto l’ambiente al quale esse si riferiscono è, a rigor di logica, un 
controsenso. ‘l'ale approssimazione diventa accettabile solo se si è già stabilito 
che le funzioni in questione si ritrovano in tutti i sistemi di cui l'elemento 
può far parte. Bisogna tuttavia temere che l’uso troppo frequente di questo 
linguaggio ellittico faccia dimenticare l’interdipendenza fondamentale che esi- 
ste tra le nozioni di funzione e di sistema. L’unica eccezione a questa regola 
corrisponde al caso degli elementi che si modificano indipendentemente dal 
loro ambiente, vale a dire ai mutamenti che possono essere spiegati a partire 
dalle sole caratteristiche intrinseche dell’elemento. Si potrebbe essere tentati 
di classificare questo comportamento sotto la voce « proprietà intrinseche » del- 
l'elemento, sottolineando cosi una separazione dalla nozione di funzione. In 
definitiva, è tuttavia preferibile includere questo particolare comportamento 
nella nozione di funzione, e come caso limite, per le seguenti ragioni. 

Una variazione spontanea di un elemento, cioè una variazione che dipende 
esclusivamente dalle sue caratteristiche intrinseche, fa effettivamente parte del 
suo comportamento. L’unico problema consiste nel sapere se questo elemen- 
to svolge un ruolo nei confronti degli altri elementi che costituiscono il suo 
ambiente ovvero, in altri termini, se l'elemento considerato e il suo ambien- 
te costituiscono effettivamente un sistema. Invero, il fatto che un elemen- 
to subisca soltanto variazioni spontanee non consente di concludere che ta- 
le elemento e il suo ambiente sono indipendenti. Ciò significa soltanto che 
il comportamento dell’elemento non dipende dal suo ambiente, ma non per 
questo la relazione inversa è esclusa, e, in questo caso, è sempre possibile che 
l'elemento eserciti un ruolo nel comportamento del proprio ambiente..Un esem- 
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pio classico di tale situazione è dato dalle catene di filiazione, nelle quali i 
discendenti dipendono dagli ascendenti, senza reciprocità. Dal momento che 
l’esistenza di variazioni spontanee in un elemento non esclude a priori che es- 
so svolga un ruolo nei confronti dell'ambiente, in definitiva è perfettamente 
logico includere le proprietà intrinseche nella nozione di funzione. Il caso in 
cui una variazione spontanea non si traduce in una funzione effettiva è cos 
ricondotto alle proprietà dell’insieme degli elementi considerati, e dipende dal 
fatto che questi ultimi costituiscano o no un vero e proprio sistema. 

Le funzioni di un elemento in un ambiente dato sono, in linea di prin- 
cipio, esprimibili a partire dalle caratteristiche intrinseche dell'elemento, dalle 
caratteristiche intrinseche degli elementi dell'ambiente, e da quelle che, non 
essendo attribuite in modo specifico ad alcun elemento, appaiono sotto forma 
estrinseca, cioè in quanto caratteristiche attribuite globalmente al sistema (nel 
caso di un campo, ad esempio). È tuttavia importante notare che, in realtà, 
lo studio della natura corrisponde anzitutto a una procedura in senso inverso. 
Si parte dall’osservazione delle interazioni, e di conseguenza delle funzioni, 
giungendo, per induzione, all’attribuzione di un certo numero di caratteri- 
stiche ad ogni elemento, cioè alla sua definizione. Si può addirittura affermare 
che, in una fase anteriore, dall’osservazione del mondo che ci circonda, dalle 
relazioni e dalle variazioni che vi scopriamo, già si forma a poco a poco la 
nozione stessa di elemento. Questa osservazione primordiale, che ci induce 
ad abbandonare la percezione indifferenziata, cioè quella di un tutto come 
elemento unico, si traduce in definitiva in due operazioni complementari, la 
prima analitica che corrisponde alla partizione in elementi, l’altra sintetica che 
rispetta l’interdipendenza delle parti sotto forma di relazioni tra gli elementi. 
La nozione di funzione corrisponde a una tappa essenziale della ricerca dei 
fattori che intervengono nelle relazioni tra elementi. Capita spesso che gli ele- 
menti di un sistema intervengano nelle relazioni che li concernono in forme 
molto diverse, cioè secondo processi che appaiono chiaramente differenti. Evi- 
dentemente, è interessante cercare di distinguere questi processi, e ricondurli 
a un numero il pit limitato possibile d’interazioni tipiche e irriducibili tra 
loro, ovvero mettere in evidenza, per l’appunto, funzioni elementari. Questa 
progressiva riduzione, di cui è evidente l’interesse per l’unificazione delle scien- 
ze, è già contenuta in nuce in ogni procedimento induttivo, nel quale si passi 
dall’osservazione delle relazioni tra elementi dell’attribuzione a questi ultimi 
di diverse caratteristiche intrinseche, come si vedrà tra poco. 

La partizione in elementi e l’attribuzione di caratteristiche intrinseche a 
questi ultimi costituiscono quindi due operazioni strettamente correlate. Non 
appena si sceglie una partizione, l'osservazione delle relazioni tra elementi per- 
mette di estrarre a poco a poco un certo numero di funzioni elementari e di 
accedere cost alle caratteristiche intrinseche. A due partizioni differenti pos- 
sono corrispondere funzioni differenti. La scelta iniziale che sta alla base della 
partizione ha perciò una grande importanza. Essa può comportare conseguen- 
ze più o meno felici sull’ulteriore sviluppo della teoria, relativamente alla sua 
estensione, semplicità o estetica. Non si può mai pretendere a priori che una 
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partizione scelta inizialmente si riveli la migliore in tutti i casi, e spesso si 
giunge a una scelta soddisfacente soltanto attraverso una serie di approssima- 
zioni successive. Inoltre, è evidente che le partizioni possibili dipendono stret- 
tamente dal livello d’osservazione al quale ci si pone. I modelli teorici elabo- 
rati per la descrizione e la spiegazione dei fenomeni possono variare notevol- 
mente a seconda di questo livello e, di conseguenza, anche a seconda della 
partizione scelta. 

Il passaggio dall’osservazione delle relazioni tra elementi alla discrimina- 
zione in funzioni elementari è generalmente difficile, come lo è ogni procedi- 
mento induttivo. È ben raro che questo passaggio appaia subito evidente e 
univoco, e ciò è tanto più vero quanto più numerosi e diversi sono gli elementi 
in presenza. Si intuisce facilmente come questo problema debba essere affron- 
tato in primo luogo sui sistemi più semplici possibili, quelli cioè che com- 
portano pochi elementi, simili o appartenenti a un ristrettissimo numero di 
tipi differenti. Inoltre, tale sistema deve poter essere considerato come isolato 
dal mondo esterno, perlomeno per tutto ciò che non è attinente alle intera- 
zioni in esame. La nostra conoscenza della natura si è sviluppata a poco a poco, 
operando appunto in questo modo, e si potrebbe addirittura dire che è pro- 
prio cercando di lavorare su partizioni del mondo, cioè su sistemi, i più sem- 
plici possibili, che la fisica classica è giunta progressivamente a individuare 
le grandi funzioni elementari del mondo materiale che oggi conosciamo. Il 
sistema semplice costituito da un qualsiasi oggetto e dalla Terra, opportuna- 
mente isolato dalle interazioni parassite con l'eliminazione dell'atmosfera, ha 
consentito di studiare la funzione peso o gravitazione, e ha portato cosf alla 
nozione di massa come caratteristica intrinseca degli elementi. Analogamente, 
partendo dapprima da un sistema semplice a due elementi si è potuto mettere 
in evidenza la funzione d’interazione elettrica e, di conseguenza, la caratteri- 
stica intrinseca di carica elettrica. La stessa situazione si è ripresentata quando 
si sono dovute precisare a livello macroscopico le interazioni che prendono 
la forma di scambi di calore o di energia meccanica, e di definire corretta- 
mente le caratteristiche di capacità calorica e di temperatura. Evidentemente, 
si potrebbero citare molti altri esempi di questo tipo. Si constata sempre che 
la scienza riesce a studiare, solo procedendo molto gradualmente, sistemi più 
complessi, nei quali intervengono simultaneamente pit funzioni elementari. 
I campi in cui il rigore appare più difficilmente raggiungibile sono appunto 
quelli in cui non si riescono a realizzare condizioni che corrispondano all’in- 
tervento di una sola funzione elementare, oppure, al limite, di un piccolissimo 
numero di tali funzioni. È il caso, in particolare, di tutto ciò che riguarda il 
mondo vivente. 

Ci si può chiedere come riconoscere in pratica che una sola funzione ele- 
mentare interviene in un sistema. In realtà, non esiste alcuna risposta sempli- 
ce a questa domanda. Si può, al massimo, enunciare un principio che costi- 
tuisce più una guida che una regola precisa. Si può affermare, in generale, 
che una funzione ‘elementare tra due elementi darà luogo a una interazione 
esprimibile con una combinazione semplice di un piccolissimo numero di ca- 
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ratteristiche. Per esempio, nel caso di un sistema materiale, si è praticamente 
sicuri di avere a che fare con una funzione elementare quando le interazioni 
osservate sono esprimibili con una sola particolare caratteristica intrinseca e 
con caratteristiche relative alla situazione spaziale ed eventualmente al moto. 
Non si tratta affatto di un giudizio prematuro, dal momento che certe caratte- 
ristiche possono apparire indipendenti a un certo livello, mentre in realtà esi- 
ste tra loro una dipendenza, che emerge a un altro livello d’osservazione e 
comporta, di conseguenza, una riduzione del numero di caratteristiche ne- 
cessarie. Cosi, le interazioni elettriche, che si esprimono semplicemente a par- 
tire dalla caratteristica di carica elettrica e dalle coordinate spaziali, appaiono 
proprio come l’espressione di una funzione elementare. Allo stesso modo, a 
livello macroscopico, si rende facilmente conto delle interazioni magnetiche 
a partire dalla nozione di massa magnetica e dalle coordinate spaziali, fatto 
che ha indotto a considerare questo tipo di interazione come elementare. Que- 
sta conclusione era certo legittima al livello d’osservazione scelto, anche se 
si è giunti in seguito a mostrare che la nozione di massa magnetica era ridu- 
cibile a quella di carica elettrica associata alle caratteristiche del moto. 

In definitiva, la parte più difficile del procedimento induttivo consiste chia- 
ramente nel mettere in evidenza le funzioni elementari a partire dall’osser- 
vazione delle relazioni tra elementi, Il passaggio della conoscenza di una fun- 
zione, riconosciuta come elementare, all’attribuzione di caratteristiche intrin- 
seche costituisce una fase meno delicata, dal momento che si traduce, in molti 
casi, nell’enunciato di un predicato qualitativo unico, accompagnato eventual- 
mente da caratteristiche quantitative proprie di ciascun elemento. In questa 
fase, la difficoltà specifica appare solo in seguito, quando ci si deve garantire 
l’indipendenza della nuova caratteristica intrinseca dalle caratteristiche già note, 
oppure, nel caso opposto, quando bisogna stabilire le vere e proprie relazioni 
di dipendenza. Questo problema in generale può essere risolto solo accedendo 
a un livello più fine di descrizione, dal momento che, se si rimane allo stesso 
livello d'osservazione, molto spesso non si può far altro che stabilire relazioni 
empiriche e non esplicative. 

È evidente che l’accesso alla conoscenza scientifica di un elemento unico, 
che si suppone totalmente isolato, è teoricamente da escludersi. Un elemento 
manifesta la sua presenza e le sue proprietà in modo duraturo o riproducibile 
soltanto grazie alle interazioni nelle quali interviene. Una sia pur minima co- 
noscenza relativa a tale oggetto esige, evidentemente, che esso agisca in qualche 
modo su noi stessi, direttamente o attraverso strumenti d’osservazione da noi 
utilizzati. Questa condizione minimale sine qua non corrisponde alla situa- 
zione di un elemento semi-isolato, vale a dire che non riceve nulla dall’esterno 
ma che emette verso l'esterno vari segnali. L'elemento considerato si trova 
dunque in uno stato instabile e, se si ammette la validità generale della legge 
di conservazione dell’energia, si può affermare che questa situazione non du- 
rerà all'infinito. Le osservazioni che in questo caso si possono fare corrispon- 
dono perciò a fenomeni transitori. Esse consentono di accedere, almeno par- 
zialmente, a una parte delle proprietà che l’elemento può manifestare, cioè 


421 Funzione 


quelle particolari funzioni che qui sono state chiamate proprietà intrinseche. 
In termini generali, i fenomeni cosî osservati dipendono dalla storia prece- 
dente dell’elemento, e in particolare dallo stato in cui si trovava nel momento 
in cui è stato isolato da ogni azione proveniente dall’esterno. Facendo variare 
questa storia anteriore alle osservazioni, è possibile mettere in evidenza di- 
versi aspetti delle proprietà intrinseche dell’elemento. 

La situazione di semi-isolamento cui si accennava è in realtà piuttosto rara, 
soprattutto se la si considera in termini rigorosi. Nella stragrande maggioranza 
dei casi, gli elementi osservati partecipano a interazioni molteplici e diverse, 
alcune delle quali possono corrispondere a scambi nei due sensi con l’ambiente 
esterno. Di conseguenza, la ricerca delle funzioni elementari può talvolta di- 
ventare molto difficile. Lo scopo da raggiungere consiste sempre nel riuscire 
a isolare un fenomeno semplice, eliminando le interazioni parassite suscetti- 
bili di modificarlo e mostrando che le interazioni secondarie che sussistono 
non hanno alcuna influenza su di esso oppure sono trascurabili. Queste ope- 
razioni di discriminazione possono essere più o meno complesse e delicate, 
non foss’altro, in primo luogo, perché la nozione stessa di fenomeno semplice 
richiede una valutazione che non è totalmente priva di soggettività, come si 
è visto. Molto spesso esse necessitano di un approccio per tentativi nel quale 
le conoscenze precedenti, le ipotesi e le verifiche sperimentali svolgono un 
ruolo importante. Capita beninteso che queste complesse procedure approdi- 
no rapidamente a situazioni semplici, e si capisce come il fatto di non ricer- 
care una precisione troppo grande sia, da questo punto di vista, favorevole. 
A titolo d’esempio, si può citare lo studio della gravità attraverso l’osserva- 
zione della caduta di un grave in prossimità della Terra. Il sistema conside- 
rato obbedisce certamente al criterio di semplicità, come dev'essere ogni volta 
che si ricerca una funzione elementare, dal momento che è costituito da due 
elementi, la Terra e il grave di cui si studia la caduta. Ma, in pratica, e senza 
particolari precauzioni, il sistema reale è più complicato, comportando anche 
l'atmosfera tra il grave e la Terra. Si tratta effettivamente, come dimostra 
l’esperienza, di un elemento parassita che deve essere eliminato, dal momento 
che perturba, a causa dei fenomeni d’attrito, l’interazione elementare che si 
vuole studiare. Per contro, le interazioni che hanno luogo tra gli elementi del 
sistema e la luce, e che sono obbligatoriamente implicate da una qualsiasi 
osservazione visiva degli elementi, appaiono come secondarie e senza influen- 
za sul fenomeno di base studiato. Questo esempio, particolarmente semplice 
nella sua concezione, è stato scelto soltanto per illustrare le nozioni di feno- 
meno parassita e di fenomeno secondario. Le situazioni di questo tipo sono 
in realtà piuttosto eccezionali, e la ricerca delle funzioni elementari si presenta 
spesso in condizioni molto più difficili. 

Le difficoltà vere e proprie emergono quando si vuole rendere conto di 
osservazioni sempre più precise. È allora frequente che un certo numero di fe- 
nomeni parassiti, che prima potevano essere trascurati, intervengano in modo 
significativo, rendendo sempre più delicato l'isolamento di un solo fenomeno. 
D'altronde, sì può affermare che, in generale, all’osservazione sempre più pre- 
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cisa di un sistema corrisponde una diminuzione del numero di fenomeni che 
possono essere considerati come secondari, e un aumento del numero di fe- 
nomeni che devono essere considerati come parassiti. Tale situazione non pre- 
senta ostacoli insuperabili finché le interazioni si ripartiscono su una scala d’in- 
tensità abbastanza grande. La progressione dai livelli d’osservazione meno pre- 
cisi a quelli più precisi consente, in tale caso, di separe in fasi successive i di- 
versi tipi d’interazioni e di valutare la loro importanza relativa. La nostra cono- 
scenza della natura nei secoli passati è progredita essenzialmente in questo mo- 
do. Le difficoltà diventano più serie quando più tipi d’interazioni si manifestano 
contemporaneamente e con un’importanza dello stesso ordine. Se le conoscen- 
ze precedenti non consentono d’identificare a priori nel fenomeno globale la pre- 
senza simultanea di funzioni elementari, oppure se procedimenti sperimentali 
sempre più raffinati non approdano alla separazione in fenomeni più sempli- 
ci, la ricerca delle funzioni elementari diventa evidentemente difficile. Capi- 
ta cosi che ci si debba limitare a evidenziare funzioni relativamente comples- 
se, o addirittura a una semplice fenomenologia globale degli effetti osservati. 
Si ritrova infine la stessa situazione quando è impossibile lavorare su siste- 
mi sufficientemente semplici, sia che non si disponga di alcun mezzo d’azio- 
ne, come in astronomia, sia che la separazione in sistemi semplici faccia scom- 
parire certe funzioni essenziali, come in biologia. Se si vuole superare la mera 
descrizione dei fenomeni, l’unico approccio rimane, nel primo caso, l’elabo- 
razione di ipotesi teoriche al livello delle funzioni elementari e la verifica del- 
la loro fondatezza attraverso le conseguenze che esse comportano per il si- 
stema considerato nel suo insieme. Nel secondo caso, la separazione in siste- 
mi più semplici può sempre essere tentata, come avviene ad esempio in bio- 
logia molecolare, ma ci si deve aspettare che il progressivo ritorno al livel- 
lo del sistema completo presenti serie difficoltà, in particolare per ritrovare 
l'origine delle funzioni che scompaiono al momento della separazione in si- 
stemi semplici. Per evitare tali difficoltà, bisognerebbe poter realizzare uno 
studio molto minuzioso di tutti i possibili sistemi intermedi tra i livelli più 
semplici e il livello globale, impresa che, nella maggior parte dei casi, è prati- 
camente impossibile. L'elaborazione di ipotesi e di modelli teorici può evi- 
dentemente essere impiegata anche per tali sistemi, ma il rischio di gratuità 
cresce rapidamente man mano che aumenta la complessità del sistema. Il ca- 
rattere ipotetico dei modelli teorici, in realtà, dipende molto dal livello di de- 
scrizione scelto, e il miglior mezzo per ridurre questo carattere ipotetico con- 
siste nel collocare la partizione teorica del sistema al livello in cui gli elementi 
sono meglio conosciuti e differiscono il meno possibile relativamente alle ca- 
ratteristiche qualitative che permettono di definirli. 

Mettere in evidenza le funzioni elementari è insomma una fase essenziale 
tra la partizione in elementi e l’attribuire loro un certo numero di caratteri- 
stiche intrinseche. Le definizioni di elementi cosî ottenute per induzione sono 
perciò definizioni funzionali, le sole accessibili al metodo scientifico. Molti- 
plicando e diversificando lo studio dei sistemi in cui interviene un dato ele- 
mento, è possibile individuare a poco a poco, con questo processo induttivo, 
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un certo numero di caratteristiche intrinseche corrispondenti alle diverse fun- 
zioni elementari alle quali è suscettibile di partecipare l’elemento considerato. 
Se i sistemi studiati sono rappresentativi della diversità dei possibili sistemi 
in cui può intervenire l'elemento, la sintesi delle definizioni funzionali otte- 
nute per ciascuno di essi consente di raggiungere una definizione universale 
dell'elemento stesso, o, perlomeno, una definizione valida per tutti i casi ri- 
scontrabili in pratica. 


3: Dal carattere locale degli elementi al carattere globale del sistema. Il 
residuo delle caratteristiche funzionali estrinseche. 


La ricerca delle caratteristiche significative di un sistema non sempre si 
conclude nella sola attribuzione di caratteristiche intrinseche agli elementi. In 
molti casi sussise ciò che, da questo punto di vista, si potrebbe chiamare un 
residuo, sotto forma di caratteristiche estrinseche, definibili soltanto al livello 
globale del sistema considerato o del suo ambiente. È raro infatti che si possa 
spingere la differenziazione di un sistema fino a eliminare ogni caratteristica 
sotto forma estrinseca. E ci si può chiedere se, in tali condizioni, la nozione 
di definizione universale di un elemento conservi un senso sufficientemente 
preciso. Tale definizione, infatti, dovrebbe contenere tutto ciò che è neces- 
sario a rendere conto del comportamento dell’elemento nelle pivi diverse si- 
tuazioni, il che esclude che certe caratteristiche appaiano esclusivamente sotto 
forma estrinseca. Per rispondere a questa domanda, bisogna anzitutto ricor- 
dare che i due tipi di caratteristiche corrispondono in realtà a due livelli dif- 
ferenti: le caratteristiche intrinseche al livello degli elementi, quelle ‘estrinseche 
al livello del sistema. In secondo luogo, bisogna notare che una caratteristica 
può essere considerata come estrinseca per svariate e molto diverse ragioni. 

Una prima ragione può essere che la caratteristica considerata corrisponda 
senza possibile ambiguità al livello del sistema; è il caso, per esempio, del 
numero totale di elementi contenuti nel sistema, indipendentemente dalla loro 
natura o dagli stati che essi occupano. 

Una seconda ragione può essere che la caratteristica esprima un’azione ester- 
na imposta al sistema; è il caso, per esempio, dell’azione di un campo esterno 
sul sistema oppure, più generalmente, dell’azione di un qualsiasi elemento 
esterno non esplicitamente descritto. Si noterà subito che, in questo caso, è 
essenzialmente la scelta iniziale fatta per la partizione in elementi a permettere 
di tradurre l’azione considerata sotto forma di caratteristica estrinseca del si- 
stema. L’unificazione del sistema inizialmente considerato e delle influenze 
esterne che esso subisce sarebbe sempre possibile e darebbe luogo a un nuovo 
sistema unico, con la riserva di un’adeguata modifica del numero e della defi- 
nizione degli elementi costitutivi. Si ritrova qui, ancora una volta, il carattere 
molto relativo della definizione degli elementi e degli stati che possono occu- 
pare, La considerazione di tutti gli stati possibili, per interazioni molto diverse, 
è essenziale nella ricerca della definizione universale degli elementi. 
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Una terza ragione consiste nel fatto che una caratteristica può essere con- 
siderata estrinseca per motivi di comodità nello studio del sistema. In questo 
caso, essa può benissimo essere espressa, se necessario, sotto forma di caratte- 
ristica intrinseca degli elementi. È questo il caso, ad esempio, della tempera- 


tura, che è una caratteristica estrinseca, e della sua traduzione in termini di ‘ 


energia cinetica degli elementi, ossia in termini che corrispondono a caratte- 
ristiche intrinseche. ) 

Una quarta ragione, infine, è che una caratteristica appaia come estrinseca 
senza che si sappia se corrisponde obbligatoriamente al livello del sistema op- 
pure se è possibile tradurla sotto forma di caratteristiche intrinseche degli ele- 
menti. Questo era il caso della temperatura prima dell’affermazione della teo- 
ria cinetica del calore. 

Gli ultimi tre casi hanno effettivamente un’incidenza diretta sulla defini- 
zione degli elementi, ma non intervengono allo stesso modo nella ricerca di 
una loro definizione universale. Il terzo caso, ad esempio, non presenta alcuna 
difficoltà, dal momento che è sempre possibile tradurre la caratteristica estrin- 
seca considerata in termini di caratteristiche intrinseche degli elementi. Per 
contro, il quarto caso rappresenta un limite imposto dalla nostra ignoranza 
del significato profondo della caratteristica estrinseca. Dal momento che non 
si può affermare che questa caratteristica non è traducibile in termini intrin- 
seci, non è possibile garantire che le definizioni adottate per gli elementi del 
sistema sono universali. Il secondo caso, infine, corrisponde a una situazione 
classica nella ricerca delle varie funzioni alle quali possono partecipare gli ele- 
menti, ed è direttamente legata alla partizione adottata nella prima fase dello 
studio. Nel nuovo sistema, ottenuto con l’unificazione del sistema considerato 
inizialmente e delle azioni esterne che esso subisce, il problema del significato 
delle caratteristiche estrinseche e della loro traducibilità in termini intrinseci 
ricalca una delle altre tre forme già citate. 

In definitiva, si può dire che si è in presenza della definizione universale 
di un elemento quando le caratteristiche intrinseche contenute in tale defini- 
zione consentono, da sole oppure combinate con le caratteristiche degli altri 
elementi, di rendere conto dell'insieme delle funzioni alle quali può parteci- 
pare l'elemento nei vari sistemi in cui può essere incluso. 

Le considerazioni precedenti consentono di fare un’ultima osservazione sul 
problema della definizione degli elementi e degli stati che sono suscettibili 
di occupare. Dato che le caratteristiche di cui bisogna tener conto possono 
essere molto differenti a seconda delle funzioni considerate, cioè a seconda 
dell'insieme degli elementi presenti, ci si può chiedere se non sia utile stabi- 
lire un certo numero di distinzioni tra i diversi tipi di caratteristiche, per 
esempio separando i loro aspetti qualitativi e quantitativi, suddividendo que- 
sti ultimi in gamme di possibili variazioni. Come si può facilmente notare, 
si tratta di un semplice problema di convenzione ma, come spesso capita, 
tale convenzione può essere utilissima per la chiara descrizione dei sistemi. 
In altri termini, è un problema di classificazione, analogo a quello che si pone 
in sistematica biologica, e che gli specialisti di questa disciplina risolvono uti- 
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lizzando le nozioni di divisione, di classe, d'ordine, di famiglia, di genere e di 
specie. È certo possibile adottare distinzioni di questo tipo nella definizione 
di qualsiasi elemento, anche se soltanto quattro nozioni sembrano essere fon- 
damentalmente utili. Si definiscano, per esempio, le seguenti categorie: 


1) L'ordine, attraverso l’esistenza di un insieme dato di predicati qualitativi. 

2) La famiglia, con gli stessi predicati qualitativi dell’ordine superiore, e 
con un certo numero di altri predicati qualitativi considerati secondari 
rispetto ai primi. 

3) Il genere, con gli stessi predicati qualitativi della famiglia superiore, 
ognuno dei quali è qui accompagnato da una caratteristica quantitativa 
situata in una certa gamma piuttosto vasta di valori. 

4) La specie (o stato), con gli stessi dati del genere superiore, ma qui ogni 
caratteristica quantitativa è situata in una sottogamma di valori più ri- 
stretta rispetto al caso del genere, o addirittura corrispondente a un 
unico valore perfettamente definito. 


Si noti fino a che punto la nozione di funzione sottende tale classificazione. 
Il passaggio dall’ordine alla famiglia introduce infatti una gerarchia di predi- 
cati qualitativi, cioè funzioni nelle quali intervengono questi predicati. Quelli 
che servono a definire l’ordine sono considerati di fondamentale importanza, 
mentre quelli che corrispondono alle varie famiglie di uno stesso ordine sono 
di secondaria importanza. D'altronde, la sistematica biologica utilizza un mag- 
gior numero di categorie proprio allo scopo di sfumare e di precisare questa 
gerarchia. Bisogna comunque evitare di spingersi troppo avanti su questa via 
che è legittima, ad essere rigorosi, solo se si conoscono perfettamente le rela- 
zioni esistenti fra tutti i predicati e tutte le funzioni nelle quali può interve- 
nire l’elemento. Evidentemente, questo non è sempre vero, soprattutto quan- 
do gli elementi considerati sono complessi. Un predicato qualitativo può es- 
sere considerato secondario soltanto se è stato possibile garantirsi che la sua 
soppressione modifica in modo trascurabile l’insieme delle funzioni alle quali 
può partecipare l'elemento. Ma l’inventario esaustivo di tutte queste funzioni 
diventa sempre più difficile man mano che cresce la complessità degli ele- 
menti. È perciò indispensabile, per qualsiasi classificazione che ammetta una 
gerarchia dei predicati qualitativi, precisare a quale insieme di funzioni essa 
si riferisce. 

La relativa importanza delle diverse funzioni non dipende soltanto, ge- 
neralmente, da un semplice giudizio qualitativo. È necessario tener conto an- 
che dei valori numerici che ad esse sono collegati, e le distinzioni quantitative 
introdotte precedentemente nelle categorie genere e specie hanno appunto que- 
sto scopo. Queste suddivisioni permettono di distinguere elementi che, anche 
xe «definiti a partire dagli stessi predicati qualitativi, fanno praticamente parte 
ili funzioni differenti, a causa delle grandezze delle caratteristiche quantita- 
tive che corrispondono a ognuno di essi. Nel caso di elementi dotati di massa 
e «di carica elettrica, ad esempio, le funzioni d’interazione gravitazionale ed 
elettrica possono intervenire simultaneamente, perché i loro ordini di gran- 
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dezza sono raffrontabili, oppure, al contrario, ridursi praticamente a una di 
esse, se i valori delle caratteristiche quantitative rendono l’altra trascurabile. 
Queste suddivisioni quantitative, scarsamente utilizzate in sistematica biologi- 
ca a causa della complessità degli elementi considerati, sono tuttavia di fon- 
damentale importanza e dovrebbero quindi essere introdotte in ogni princi- 
pio universale della classificazione. 

In modo del tutto generale si può dire che la nozione di funzione si situa 
al tempo stesso all'origine e al termine di ogni procedimento scientifico. A 
partire dalla suddivisione in elementi e dall’osservazione delle funzioni d’inte- 
razione tra di essi, si giunge alla definizione degli elementi stessi. In seguito, 
con una teoria deduttiva, vale a dire che obbedisce a regole logiche, si cerca 
di prevedere quel sarà il comportamento di questi elementi in un sistema non 
ancora osservato sperimentalmente. Tutto questo processo, induttivo e de- 
duttivo, appare quindi, in definitiva, come uno sforzo di generalizzazione e 
di sintesi delle nostre conoscenze al livello della nozione di funzione, fatto 
che sottolinea tutta l’importanza di quest’ultima. 


4. Funzione di un sistema in presenza di altri sistemi. Relazioni struttura- 
funzione. Verso la nozione di funzione finalizzata. 


Finora si è ammesso che gli elementi costitutivi di un sistema fossero es- 
seri definiti, ciascuno globalmente, da un certo numero di caratteristiche che 
permettono di esprimere le loro diverse funzioni nel sistema. Ma, in realtà, 
un elemento qualsiasi può, a sua volta, essere un sistema. Questa situazione 
induce a esaminare come può essere tradotta la nozione di funzione applicata 
a un sistema, posto in presenza di altri sistemi che costituiscono il suo am- 
biente. 

La trasposizione in questa nuova ottica delle considerazioni sviluppate pre- 
cedentemente a proposito delle funzioni di elementi definiti, ciascuno, attra- 
verso diverse caratteristiche globali, è un’impresa delicata che richiede un’ana- 
lisi fine dei concetti utilizzati, e che non può essere dettagliatamente descritta 
in questo articolo. Qui non si farà altro che delinearne le fasi essenziali, rife- 
rendo comunque alcune delle difficoltà incontrate, e indicando le principali 
nozioni alle quali si giunge. 

Quando gli elementi diventano sistemi, questi ultimi devono, per defini- 
zione, essere descritti in quanto tali, e non più soltanto attaverso caratteristi- 
che globali. Il primo problema che si pone allora è sapere quali dati pertinenti 
saranno utili a questa descrizione, in modo che possano effettivamente essere 
collegati alla nozione di funzione, pur rimanendo a un livello di generalità 
sufficiente per essere applicabili alle varie situazioni particolari. 

Si approda, in questo modo, alla nozione di struttura, o più esattamente 
a concetti precisi che si riferiscono a questa categoria di pensiero, associata 
successivamente a vari qualificativi, esprimenti aspetti diversi delle possibili 
interazioni o funzioni. Da un punto di vista generico, la nozione di struttura 


427 Funzione 


riguarda la disposizione delle parti di un sistema, cioè il modo in cui i suoi 
elementi costitutivi interagiscono, si combinano, si scambiano, ecc. 

Cost, a seconda dei caratteri sui quali si fissa l’attenzione, è possibile de- 
finire diversi tipi di strutture, attraverso distinzioni che appaiono essenzial- 
mente legate alla particolare rilevanza data ora agli aspetti dinamici dei sistemi 
ora a quelli statici. È ovvio che la descrizione dinamica è la più ricca, non fos- 
s’altro perché contiene l’altra come caso particolare, ma, evidentemente, è an- 
che la più delicata. La fonte principale delle difficoltà incontrate consiste nel 
fatto che l’adeguata descrizione dei sistemi varia, in generale, a seconda del- 
l’importanza delle interazioni che esistono tra di essi, cioè a seconda del fatto 
che queste interazioni siano forti o deboli. Il problema esiste già per la deter- 
minazione delle caratteristiche degli elementi definiti globalmente, ma è evi- 
dentemente amplificato quando si tenta di ottenere una descrizione pi fine, 
e non soltanto globale. Le caratteristiche ottenute per induzione a partire dal- 
l'osservazione delle proprietà degli elementi, inclusi nei più semplici sistemi 
possibili (condizione altamente auspicabile, come si è visto, per la determi- 
nazione di funzioni elementari), non rimangono necessariamente valide per 
lo studio dei sistemi più complessi nei quali possono intervenire questi ele- 
menti. La difficoltà essenziale, in questo genere di estrapolazione, deriva dalle 
ipotesi che si è indotti a formulare relativamente al carattere variabile o inva- 
riabile delle caratteristiche utilizzate. Può capitare che alcune di esse, apparse 
come costanti nei sistemi semplici che sono serviti a determinarle, debbano, 
in realtà, essere considerate come variabili, qualora gli elementi in questione 
siano inseriti in altri sistemi. Che ci si situi al livello dei sistemi costituiti 
da elementi definiti globalmente, oppure a quello dei sistemi di sistemi, si 
ritrova lo stesso problema, ma fortemente accentuato nel secondo caso. Non 
è certo ‘azzardato individuarvi uno dei problemi più fondamentali e difficili 
della metodologia scientifica. Molti errori sono senza dubbio commessi in se- 
guito a ipotesi difettose su questo punto, e forse soprattutto nella nostra epoca, 
in cui la scienza esplora sistemi sempre più complessi per i quali il passaggio 
dalla dissezione analitica alla ricomposizione sintetica è sempre più delicato. 

Si può dire, infine, che tutto ciò che riguarda l’analisi delle nozioni di strut- 
tura, e di conseguenza le relazioni tra struttura e funzione, costituisce un pas- 
saggio obbligato per l’esame pertinente ed approfondito del concetto di «fun- 
zione finalizzata», lasciato da parte all’inizio di questo articolo, in quanto non 
appartenente «puramente» alla nozione fondamentale di funzione, bensi ad 
un complesso di nozioni. Infatti, dal momento che ogni struttura privilegia 
certi percorsi d’azione o d’evoluzione, è chiaro che ogni elemento in essa in- 
cluso eserciterà, in realtà, soltanto una parte delle funzioni di cui è potenzial- 
mente capace. E si può anche prevedere che questo fenomeno di « direzionalità », 
presente in ogni comportamento finalizzato, sarà tanto più marcato quanto 
più complessa, o comunque specifica, sarà la struttura. Bisogna anche notare 
che è proprio l'introduzione degli aspetti dinamici ed evolutivi delle strutture 
n permettere di considerare i più spettacolari processi finalizzati, ad esempio 
quelli che si incontrano in morfogenesi biologica, soprattutto in embriologia. 
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Tuttavia, al di là delle considerazioni generali che si potrebbero sviluppare 
in questa direzione, ogni funzione finalizzata richiede, proprio per la sua Ha 
cificità, uno studio particolare che faccia intervenire 1 caratteri peculiari ella 
struttura in cui si manifesta. Ne deriva che tale nozione è più di competenza 
dell'esame di numerosi casi particolari che di un’analisi epistemologica ge- 


nerale. 


s. Il caso dei sistemi astratti. Dalla nozione di funzione alle nozioni di si- 
gnificato e d'informazione. 


Quanto precede è applicabile senza difficoltà ai sistemi materiali, per i quali 
le nozioni d’interazione e, di conseguenza, di funzione, appaiono naturali e 
suscettibili di una ‘descrizione obiettiva. È interessante chiedersi che ne è di 
queste nozioni quando si cerca di applicarle a sistemi astratti a proposito SE 
quali, per definizione, non è più possibile postulare un comportamento indi- 
pendente dalla mente che li concepisce. ei cdi 

L’obiezione che può essere rivolta a questa distinzione tra sistemi mate- 
riali e sistemi astratti deriva dalla constatazione che la nostra conoscenza di 
un qualsiasi sistema materiale fa sempre, e necessariamente, intervenire un 
sistema astratto, ovvero una rappresentazione adattata al nostro intendimento. 
Cosi, secondo questa obiezione, ogni conoscenza sarebbe riducibile, in ultima 
analisi, alle rappresentazioni astratte alle quali essa corrisponde nella nostra 


: Dar se : . : pa 
. mente, sotto forma d’immagini e d’idee. È innegabile che ogni conos 


ha effettivamente bisogno dell’intervento dei sistemi astratti del nostro intel- 
letto. Ciò non significa tuttavia che il completo processo della conoscenza sia 
riducibile a questa fase, in tutti i casi e per tutti 1 tipi di sistemi che si presen- 
tano alla nostra comprensione. Esiste infatti una differenza essenziale tra i 
sistemi materiali e quelli astratti. I primi possono avere una Pensa 0 
cifica, e certe loro interazioni possono verificarsi’ indipendentemente la dl 
tervento della nostra mente. La caduta di un corpo in un campo CA 5 
oppure il moto dei pianeti nel sistema solare, sono fenomeni indipendenti al- 
“la conoscenza che ne abbiamo. Ì sistemi astratti invece non possiedono una 
loro specifica spontaneità, e le interazioni che possono avvenire tra di S 
richiedono necessariamente l'intervento della mente. Due sistemi di parole, 
ognuno dei quali costituisca una frase, potranno interagire soltanto nel Lar 
cesso cognitivo, cioè grazie all'intervento della mente che, in questo caso, svol- 
ge il ruolo di terzo sistema obbligatorio. Per riconoscere questa e i 
senziale tra i due tipi di sistemi, non è necessario entrare nel paradossi lella 
querelle tradizionale tra filosofi realisti e idealisti. Da un punto di vista - 
tifico, si giungerebbe a questo tipo di problema solo se si cercasse ; studiare 
i rapporti tra una realtà postulata e le rappresentazioni che di essa Mino, op 
pure se si cercasse di analizzare in quale misura gli strumenti materiali che 
utilizziamo come intermediari indispensabili alla nostra conoscenza siano ca- 
paci di modificare i fenomeni osservati. Ma non è lo scopo che qui ci si pro- 
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pone. Basti constatare che le interazioni tra sistemi materiali possono verifi- 
carsi indipendentemente dall'intervento della nostra mente, mentre questo tipo 
d’interazione non è possibile per i sistemi astratti. Se tale può essere un mo- 
tivo per giustificare la distinzione fatta tra le due categorie di sistemi, bisogna 
anzitutto dire che questa distinzione è utile, dal momento che lo studio sepa- 
rato delle interazioni tra sistemi astratti consente di capire meglio come la 
mente intervenga nel processo cognitivo, quali sono le tendenze profonde che 
ad essa corrispondono e, di conseguenza, qual è l'origine di un certo numero 
di difficoltà fondamentali contro le quali ci si scontra inevitabilmente in qual- 
siasi procedimento cognitivo che faccia intervenire le nozioni di sistema, di 
struttura e di funzione. 

In primo luogo bisogna notare che, quando la si traspone dai sistemi ma- 
teriali a quelli astratti, la nozione di funzione subisce uno spostamento che 
la fa corrispondere praticamente, nel secondo caso, alla nozione di « signifi- 
cazione ». Parallelamente, la nozione d’interazione, applicata ai sistemi astratti, 
tende ad esprimere l’interdipendenza delle significazioni proprie di ciascuno 
di questi sistemi. Questa situazione è evidentemente la conseguenza dell’inter- 
vento obbligatorio della mente in tutto ciò che può essere contenuto nel ter- 
mine ‘interazione’, applicato ai sistemi astratti. Come si è visto, questo tipo 
d’interazione può aver luogo soltanto nel terzo sistema costituito dalla mente 
che conosce, e perciò può rapportarsi soltanto a ciò che, in questa mente me- 
diatrice, costituisce un riferimento sufficientemente universale per essere ap- 
plicabile a tutto ciò che è suscettibile d’essere oggetto di conoscenza; la si- 
gnificazione svolge per l’appunto questo ruolo. Si potrebbe credere che il pas- 
saggio dalla funzione alla significazione non sia altro, in definitiva, che una tra- 
Sposizione sinonimica, adattata ai vari tipi di sistemi. E questa opinione non 
può che rafforzarsi se si osserva che, per i sistemi materiali, la sostituzione 
dlel primo termine con il secondo non presenterebbe molti inconvenienti. La 
funzione di un sistema materiale A, situato in un ambiente costituito da altri 
Wistemi materiali B, C, D, ..., potrebbe benissimo essere considerata come 
ciò che esprime la significazione del sistema A per l’ambiente nel quale si 
trova oppure, al contrario, la significazione dell'ambiente per il sistema A. 
Ma, in realtà, la nozione di significazione non ha esattamente le stesse frontiere, 
né le stesse implicazioni, della nozione di funzione. Se è vero che le differenze 
tru questi due concetti possono talvolta apparire come distinzioni dai contorni 
molto sfumati, non per questo sono inesistenti, e addirittura rivelano molto 
hene gli orientamenti profondi della mente, e di conseguenza le tendenze che 
vi si può aspettare di ritrovare in ogni processo cognitivo. Si è visto che la 
nozione di funzione pone essenzialmente l’accento sull’insieme delle azioni re- 
viproche che si verificano tra gli oggetti consideratî. La funzione di un sistema 
A in un ambiente dato tiene simultaneamente conto del ruolo di A nei con- 
lronti dell'ambiente e dei mutamenti che A può subire a causa di esso. Solo 


in quanto inclusione marginale, e per giungere a un contenuto esaustivo, la 
nozione di funzione applicata a un oggetto come il sistema A contiene anche 
le proprietà intrinseche di questo sistema, vale a dire ciò che, nel suo com- 
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portamento, non dipende dall'ambiente. Per contro, la nozione di significa- 
zione considerata laddove prende origine, ovvero nelle interazioni che fanno 
intervenire la mente, appare soprattutto centrata sul caso particolare relativo 
alle proprietà intrinseche. Nella significazione data a un oggetto A da parte 
della mente che ne prende conoscenza, si constata soprattutto l’azione del- 
l'oggetto sulla mente e non il contrario. Le caratteristiche specifiche della men- 
te intervengono evidentemente nella rappresentazione che ci costruiamo del- 
l'oggetto, ma non si tratta, ad essere precisi, di un’azione della mente sull’og- 
getto, bensi soprattutto di una particolare strutturazione di ciò che ci pro- 
viene dall’oggetto. Nella misura in cui la significazione, nel suo stretto legame 
con la conoscenza, implica anche l’interdipendenza o il confronto degli ogget- 
ti che la mente concepisce o percepisce, si può dire che questo procedimento 
interviene solo in un secondo tempo, dopo la considerazione di ciascuno degli 
oggetti in questione. Il posto preminente che cosf si attribuisce alle caratte- 
ristiche intrinseche di ogni oggetto, cioè al suo «essere», si ritrova in realtà 
in ogni processo cognitivo e sembra quindi corrispondere a una costante del- 
lo spirito. In tale processo, esiste sempre una fase in cui si è indotti a distin- 
guere vari oggetti e a dire che cosa sono, mentre le interazioni tra questi og- 
getti appariranno in seguito come legate all'esistenza degli esseri cosi definiti, 
quasi che trovassero la loro origine in questi stessi esseri. Si potrebbe pensare 
che si tratti di un procedimento riservato esclusivamente alla metafisica, men- 
tre lo stesso tipo d’operazione si ritrova in ogni procedimento scientifico. Ciò 
è chiaramente dimostrato da quanto detto finora sullo studio degli elementi 
e dei sistemi; alle operazioni di partizione in elementi corrisponde la fase in 
cui i fenomeni si manifestano come aventi origine in esseri distinti. Esistono 
soprattutto due importanti differenze tra il procedimento metafisico e quello 
scientifico. Esse consistono, innanzitutto, nel fatto che il primo definisce i pro- 
pri oggetti a priori, o quasi - a priori, deducendo in seguito le loro interazioni, 
mentre il secondo opera quasi - a priori soltanto per la partizione in elementi 
e definisce i propri oggetti solo a partire dall’osservazione delle interazioni; 
in secondo luogo, nel fatto che le definizioni metafisiche sono esaustive, men- 
tre quelle scientifiche sono soltanto funzionali. 

Parlare di significazione richiama infine la nozione d’«informazione», dal 
momento che l’informazione, in qualche modo, si riferisce sempre a un tra- 
sporto di significanti. Emerge cosi la trama capace di collegare i concetti di 
funzione e d’informazione. Questa constatazione non è nuova, basti pensare 
che la nozione d’informazione è già stata ampiamente usata per rendere conto 
del comportamento di numerosi sistemi, da un punto di vista tecnico o scien- 
tifico. Bisogna tuttavia riconoscere che questo uso talvolta suscita molte per- 
plessità, attestate, ad esempio, dalle frequenti critiche relative all’uso del con- 


| cetto d’informazione genetica in biologia molecolare. Infatti, spesso non si è 


molto lontani da un uso metaforico, quando si trascrive in questo linguaggio 
ciò che corrisponde, in definitiva, a diverse interazioni specifiche, e, di con- 
seguenza, a diverse funzioni combinate in modo pit o meno complesso, a 
seconda dei caratteri strutturali del sistema in cui si svolgono. Per ritrovare 
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un modo di spiegazione suscettibile d’essere più largamente accettato, biso- 
gnerebbe che ciò che appare metaforico fosse sufficientemente esplicitato per 
raggiungere lo status degli abituali enunciati scientifici che, senza escludere 
le analogie, impongono a queste ultime limiti severi riguardanti soprattutto 
la possibilità di concepire fisicamente i processi tra i quali esse stabiliscono 
relazioni. Nei casi appena citati, la gradazione concettuale che va dalla nozione 
di funzione a quella d’informazione, o viceversa, sembra corrispondere al più 
naturale approccio epistemologico per ridurre le difficoltà incontrate. [P. D.]. 


La funzione di qualunque oggetto (cfr. soggetto/oggetto) è legata al comporta- 
mento di quest’oggetto in un dato ambiente, esso stesso costituito da elementi di- 
versi. La nozione di funzione è dunque inseparabile da quella d’interazione e di con- 
seguenza da quella di sistema. D'altra parte essa si trova tanto all’inizio quanto alla 
fine di qualunque procedura scientifica. La conoscenza comincia con la suddivisione 
dei fenomeni in elementi (cfr. fenomeno, dato). In seguito si procede alla determina- 
zione delle funzioni d’interazione tra gli elementi, delle relazioni di dipendenza/in- 
dipendenza tra di essi, cercando sempre una riduzione a interazioni tipiche ed estre- 
me (cfr. spiegazione), pervenendo cosi alla definizione degli elementi (cfr. concetto). 
Qui termina la procedura analitica e induttiva e ne comincia un’altra, deduttiva e sin- 
tetica (cfr. analisi/sintesi, induzione/deduzione). Si tratta ora della previsione di 
quello che sarà il comportamento di tali elementi in un sistema non osservato speri- 
mentalmente (cfr. esperimento). Ciò pone molteplici problemi, relativi sia alle rela- 
zioni del sistema studiato con altri che costituiscono il suo ambiente (cfr. struttura), 
sia ai livelli d'osservazione in cui ci si pone (cfr. sistematica e classificazione) 
nella costruzione delle ipotesi o dei modelli (cfr. modello) capaci di permettere delle 
generalizzazioni (cfr. locale/globale, semplice/complesso). Per di più, nelle fun- 
zioni finalizzate (cfr. organismo, vita, società) il problema della causalità si complica 
(cfr. causa/effetto). Nei sistemi astratti (cfr. senso/significato, rappresentazione), 


ln presenza del linguaggio implica il soggetto, e la funzione diventa anche informa- 
zione. 
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Infinitesimale 


Questo articolo si propone di esporre la soluzione del classico paradosso de- 
gli infinitesimi leibniziani con il metodo — meramente logico — della cosiddetta 
analisi non standard. Sviluppato negli anni ’60 dalla scuola di Robinson, ta- 
le metodo ha una grande portata euristica, problematica ed epistemologica 
per le seguenti ragioni. Come progetto (galileiano) di matematizzazione della 
natura, la scienza moderna inizia con la dinamica, cioè con la teoria matematica 
del movimento. Qualunque siano i paradigmi che si sono poi succeduti (ter- 
modinamica, meccanica quantistica, biologia molecolare, teoria dei sistemi, 
strutture dissipative, teoria delle catastrofi, ecc.) è impossibile sottovalutare 
l'ampiezza (ancora attuale) della rottura,.da essa segnata, non fosse altro per 
il fatto che la dinamica, dopo aver fornito fino a saturazione norme alla no- 
stra episteme, resta ancora uno dei propulsori principali delle matematiche 
contemporanee (problema degli n corpi, turbolenza, analisi qualitativa dei si- 
stemi dinamici, teoria della stabilità strutturale e delle biforcazioni, ecc.). Ora, 
appena si risale dal suo formalismo di base — cioè il formalismo differenziale 
— fino al suo concetto primitivo — vale a dire quello di infinitesimo — ci s'im- 
batte in una contraddizione. Data infatti la struttura archimedea della retta 
reale, una quantità infinitesimale è necessariamente nulla. Se il continuo è di- 
visibile all'infinito senza residuo, non si dànno né degli «atomi» indivisibili 
che possano fermare il processo di divisione, né degli infinitamente piccoli che 
lo esauriscano. 

Dunque, quel che sembra più certo alla ragione moderna (certo al punto da 
avere forza di legge) si basa, apparentemente, su un calcolo sintatticamente 
consistente e semanticamente inconsistente. C'è qui come uno scandalo meto- 
dologico, un’alienazione epistemologica, una spaccatura ontologica, in breve 
un dimezzamento che esige una chiarificazione. Verrà delineata qui la sua sto- 
ria teorica e non quella aneddotica. 

Questa storia abbastanza movimentata può essere divisa in prima approssi- 
mazione in tre periodi. Il primo, che va da Leibniz a Cauchy passando per Eu- 
lero, è quello dell’elaborazione e dello sviluppo del calcolo differenziale e inte- 
grale secondo lo stile leibniziano. Il secondo, che conduce direttamente all’ana- 
lisi contemporanea, comincia, con Cauchy e Weierstrass, con una crisi di ri- 
gore, la rimozione degli infinitesimi leibniziani e la loro sostituzione con un 
calcolo di limiti. Questo nuovo calcolo nello stesso tempo sintatticamente e se- 
manticamente consistente, si è rivelato poi di una tale efficacia che la questione 
iniziale dello statuto logico-concettuale degli infinitesimi si è trovata a poco a 
poco sedimentata, relegata, dimenticata, cancellata, rimossa: in ogni caso, è 
decaduta al rango di una curiosità per filosofi (anche se matematici come Peirce 
vi davano ancora grande importanza). È soltanto negli anni ’60 di questo se- 
colo che tale questione è stata riattivata grazie all’analisi non standard e ciò in 
un modo, sulle prime, abbastanza strano. 
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Se si volesse infatti datare l’origine di questo terzo periodo, occorrerebbe ri- 
salire agli anni ’20, ai primi lavori di Skolem sui modelli non standard. All’ini- 
zio si tratta di una problematica puramente logica: non ha alcun legame diretto 
con nessun dominio specifico della matematica, in particolare, dunque neanche 
col calcolo differenziale. ì | 

Il problema che si poneva Skolem era quello di sapere in quale misura il 
linguaggio formale che si utilizza per parlare di un oggetto matematico permetta 
di caratterizzarlo (almeno strutturalmente). Si trova che in generale ciò è im- 
possibile. Dunque esisteranno in generale classi di oggetti differenti (non iso- 
morfi) sintatticamente indiscernibili, cioè che possiedono esattamente le stesse 
proprietà purché queste siano formulate in un certo linguaggio di base. Tale ri- 
sultato manifesta una spaccatura — generale e non eliminabile — tra sintassi L 
semantica; ci si è presto resi conto che il paradosso semantico degli infinitesi- 
mali non ne è altro che un caso particolare. 

Si consideri infatti l'insieme R dei numeri reali corredato della sua struttura 
algebrica, della sua struttura d’ordine e della sua struttura topologica. Sia L 
un linguaggio formale di base che si utilizza per «parlare » di R. Esistono esten- 
sioni *R di R (corredate di una struttura algebrica, di una struttura d’ordine e 
di una struttura topologica) che sono indiscernibili da R relativamente a L, 
cioè che hanno esattamente la stessa teoria purché quest’ultima sia ridotta agli 
enunciati esprimibili in L. Una tale estensione viene chiamata modello non 
standard della teoria dei numeri reali. Se si tratta di una estensione in senso 
proprio, poiché *R è (al pari di R) totalmente ordinatò, esistono in *R dei 
numeri che sono «infiniti» relativamente ad R, cioè dei numeri maggiori di 
tutti i numeri di R. Gli inversi di questi numeri infiniti sono degli infinitesimi 
nel senso leibniziano del termine. 

Ma questo primo chiarimento non è certo sufficiente per fondare una dottri- 
na degna del nome di analisi non standard. Se infatti *R è un modello non stan- 
dard qualunque di R - la cui esistenza è assicurata soltanto dal teorema generale 
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Figura 1. 


La storia logico-concettuale dell’infinitesimale: un andamento non lineare, ma ra- 
mificato. 


445 Infinitesimale 


di esistenza dei modelli non standard — non vi si possono in generale prolun- 
gare funzioni familiari come le funzioni trigonometriche, esponenziali o loga- 
ritmiche. Non si potrebbe dunque parlare di analisi su *R. Come tale l’analisi 
non standard presuppone un metodo di costruzione di particolari modelli non 
standard ai quali tutte le entità costitutive del discorso dell’analisi siano auto- 
maticamente prolungabili. 

La temporalità propria della storia logico-concettuale degli infinitesimi non 
è dunque quella di una storia lineare. È una temporalità ramificata e ricorrente 
che può venir grosso modo schematizzata come nella figura 1. 


1. Il paradosso degli infinitesimali. 


r.1.. N ZQ0,R90,C. 
Sarà bene cominciare col ricordare le strutture di cui si farà uso. 


Sia R l’insieme dei numeri reali (di un certo universo della teoria degli in- 
siemi). Esso si costruisce a partire dall'insieme di base N degli interi naturali 
in tre tappe. 

La prima è la costruzione dell'insieme Z degli interi positivi e negativi per 
aggiunta a N degli interi negativi. Z è un anello commutativo totalmente or- 
dinato. 

La seconda è la costruzione dell’insieme Q dei numeri razionali per aggiunta 
a Z degli inversi 1/p dove pe Z è un intero non nullo. Q è un corpo commuta- 
tivo totalmente ordinato detto corpo delle frazioni di Z. 

Esistono due differenze essenziali tra Z e Q. Prima di tutto Q è un corpo 
mentre Z non è che un anello: mentre l’inverso di un intero 7 non nullo non è 
un intero (eccetto che per 7= +1), l'inverso di un razionale non nullo è ra- 
zionale. Per costruzione, Q è il più piccolo corpo contenente Z. 

Per ulteriori particolari si rimanda all’articolo «Calcolo» in questa stessa 
Enciclopedia (vol. Il, cfr. in particolare pp. 389-96). Va ancora ricordato che 
Q ammette una topologia indotta dalla metrica definita dalla distanza d(x,y)= 
=|x-—y| ove con |x| si denota il valore assoluto di x. Com'è noto, in Q esistono 
numeri arbitrariamente vicini gli uni agli altri. Ma l’esistenza di numeri irra- 
zionali come 2 mostra che Q ron è un continuo. Benché gli elementi di Q 
si «susseguano» gli uni agli altri (ordine totale) non essendo separati che da 
distanze «infinitesimali», Q è in qualche modo «incompleto» rispetto alla sua 
topologia. Di qui l’idea di un «completamento» topologico di Q. 

È questa la terza tappa, cioè la costruzione del corpo totalmente ordinato 
R dei numeri reali per completamento di Q. Esistono diversi metodi, il più 
celebre dei quali è quello di Dedekind. Per costruzione, Q è denso in R: ogni 
numero reale è approssimabile, con la precisione che si desidera, mediante nu- 
meri razionali. 

Completando Q si aggiungono «molti» numeri nuovi. Q ha infatti per car- 
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dinale (nel senso della teoria di Cantor) la potenza del numerabile (esistono 
procedure molto semplici che permettono di enumerare i razionali). Al contra- 
rio, il continuo R ha per cardinale la potenza del continuo che è un numero 
transfinito strettamente maggiore. Si può anche dire che, se si sceglie a caso un 
numero reale, si ha una probabilità certa di ottenere un irrazionale e una proba- 
bilità nulla di ottenere un razionale: «pressoché tutti» i numeri reali sono ir- 
razionali. (Questo risultato non è molto soddisfacente dal punto di vista con- 
cettuale perché esiste comunque un'infinità di razionali distribuiti in R in modo 
denso. In realtà, è uno degli aspetti in cui può ripresentarsi il paradosso degli 
infinitesimi. Bisognerebbe dire che la probabilità P di trovare un razionale sce- 
gliendo un numero reale a caso è infinitesimale. Ma sinché le probabilità sono 
dei numeri reali, P è necessariamente zero; le cose cambiano nel caso in cui si 
considerino delle probabilità in un modello non standard di R). 

I numeri irrazionali si dividono a loro volta in due classi. In una gli irraziona- 
li algebrici (come V2) che sono soluzione di una equazione algebrica x%-+ 
+a,-14"1+...+4,Xx-+a,=0 a coefficienti a; razionali. Nell’altra gli irrazionali 
trascendenti (come x o e). Poiché è facile costruire degli algoritmi che permet- 
tano di enumerare i numeri algebrici, il loro insieme ha la potenza del numera- 
bile. «Pressoché tutti» i numeri reali sono dunque trascendenti benché non si 
diano che pochissimi esempi espliciti. 

La considerazione dei numeri algebrici conduce naturalmente ad altre esten- 
sioni di Q e di R. V/2 e — V/2 sono entrambe soluzioni dell’equazione algebrica 
di secondo grado x°—-2=0. Ma se si considera l’analoga equazione x*+2=0 
si constata subito che non ha alcuna soluzione reale poiché, essendo ogni qua- 
drato positivo, si ha sempre x2+2>2. È dunque naturale cercare di «comple- 
tare» Q ed R relativamente all’esistenza delle radici delle equazioni algebriche in 
generale. 

Nel caso di R, si cercherà una estensione R di R che sia il più piccolo corpo 
contenente R tale che ogni equazione algebrica di grado x a coefficienti in R 
vi abbia x radici (distinte o no). R si dice una chiusura algebrica di R ed è unica 
a meno di isomorfismi. Per ottenere R basta aggiungere a R l’unità immagi- 
naria i=V—-1: R=R(i) è il corpo € dei numeri complessi (C è un corpo to- 
pologico commutativo, topologicamente completo e algebricamente chiuso, che 
non possiede più una struttura d’ordine naturale: cfr. « Calcolo », pp. 430-33). 

‘Tale risultato è notevole poiché mostra che C è uno spazio vettoriale su R di 
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dimensione 2 (come mostra la rappresentazione vettoriale dei numeri com- 
plessi) e dunque — essendo ogni estensione di R uno spazio vettoriale su R - 
che non esistono corpi intermedi tra R e la sua chiusura algebrica. 

Tutt'altro accade per Q. Sia Q la chiusura algebrica (supposta inclusa in C) 
di Q, ottenuta aggiungendo a Q le soluzioni (esistenti in C per costruzione di 
C) delle equazioni algebriche a coefficienti in Q. Si può mostrare che, come spa- 
zio vettoriale su Q, Q è di dimensione infinita e che esiste una infinità di esten- 
sioni intermedie QCKCQ di dimensione finita su Q. Queste estensioni, chia- 
mate corpi di numeri algebrici, sono l’oggetto della teoria dei numeri (si veda 
l’articolo « Divisibilità» in questa stessa Enciclopedia). 

Le grandi strutture numeriche che servono di base all’aritmetica, all’algebra 
e all'analisi, sono dunque collegate dalla rete di inclusioni schematizzata nel- 
la figura 2. 

Se (dalla fine del x1x secolo con Kronecker, Weber, Dedekind, ecc.) la teo- 
ria dei numeri è innanzitutto lo studio delle proprietà di divisibilità, se la geo- 
metria algebrica è prima di tutto (da Riemann in poi) lo studio degli anelli di 
polinomi e dei corpi di funzioni razionali, l’analisi, di per sé, è innanzitutto lo 
studio delle classi di funzioni definite su R e su C. 

Ci si limita qui all’analisi reale. Il corpo di base sarà dunque R, corpo topo- 
logico commutativo, topologicamente completo e totalmente ordinato. Quanto 
alla sua struttura d’ordine, R possiede la proprietà (ereditata da N) di essere 
archimedeo: per ogni x>o di R, arbitrariamente piccolo, e per ogni M>o di R, 
arbitrariamente grande, esiste un intero n tale che nx>M: si può dunque «ol- 
trepassare » qualunque numero a partire da qualunque altro. Ciò implica che R 
non possiede infinitesimi. 


1.2. L’infinitesimale leibniziano come sovvertimento della referenza. 


Agl’inizi, l’analisi su R riguarda da una parte la ripresa dei metodi integrali 
di Archimede per il calcolo delle aree e dei volumi e dall’altra lo studio delle 
proprietà differenziali delle funzioni. Queste funzioni sono sia funzioni reali 
f:R+R (x+>f(x)) di una variabile reale x, sia funzioni reali f : R*-+R((x,, ..., 
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Figura 3. 


La tangente a una curva in un punto. 
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x,)>f(%1, --.,p)) di più variabili reali x1, ..., %,, sia funzioni f : R"+R"((x,, ..., 
Xn) (Fi (1 4 nda fn (1 *n))) in cui fi, ..,fn sono funzioni di R” in R, 
sia infine finzioni implicite fu y)=0. 

La nozione insiemistica di funzione come legge che associa a ogni elemento 
x del dominio di definizione un elemento f(x) del dominio dei valori, si è pro- 
dotta solo più tardi (cfr. gli articoli «Applicazioni» e « Funzioni» in questa 
stessa Enciclopedia). Inizialmente si trattavano funzioni la cui espressione è espli- 
cita (trigonometriche, esponenziali, logaritmiche; coniche, cubiche, ecc.; spi- 
rali, lemniscate, ecc.) e si rappresentavano con i loro grafici. Se per esempio 
f(x) è una funzione di R in R la sua rappresentazione grafica è la «curva» del 
piano R? di equazione y=f(x). 

La rappresentazione simbolica (dovuta a Descartes) delle curve in termini 
di coordinate segnò una rottura essenziale in quanto a) fece «passare » alla scrit- 
tura l’intuizione geometrica del percepito; e d) apri al concetto di relatività: 
poiché un oggetto geometrico non può essere algebrizzato (cioè espresso sim- 
bolicamente) che in relazione a un sistema arbitrario (relativo) di riferimento, 
le sue proprietà intrinseche devono risultare invarianti per cambiamenti di ri- 
ferimento. 

Ci sarebbe tutta una «archeologia» da de-sedimentare circa il rapporto tra 
geometria e scrittura: a partire dalla rottura cartesiana la geometria verrà su- 
bordinata al primato della scrittura e sarà soltanto nei periodi critici in cui viene 
ripensata e ristrutturata che essa ritornerà a data fenomenologici (geometrie 
non-euclidee, geometria sintetica, superfici di Riemann, catastrofi). Ora, appena 
si ammette, per ragioni di efficacia metodica, un tal primato della scrittura 
simbolica, si deve altrettanto esigere che «passino» alla scrittura le intuizioni 
geometriche di base. 


'Tra queste s'impone immediatamente la nozione di tangente. Data una 
funzione f(x) che possiede una certa «consistenza», il cui grafico y=f(x) sia 
cioè una curva (C') nel senso intuitivo e materiale del termine (un tracciato sul 
piano), è possibile in generale associare a ogni punto My= (xo,f(xo)) di (C) 
una tangente 7 (x) definita come la retta che approssima meglio (C) in Mp, 
cioè il cui «contatto» con (C) in M, è massimale (fig. 3). 

Ci sono due modi di avere intuizione di una tangente, l’uno «dinamico» 
e l’altro «statico». Ciascuno di essi dà luogo a una specifica traduzione scrit- 
turale. 


T;(%0) 
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Figura 4. 


La tangente come limite. 
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1) Nell’intuizione «dinamica», la retta 7,(xy) è il limite delle secanti MM, 
di (C) per il punto M, che tende verso il punto M, (fig. 4). 

Questa intuizione «passa » facilmente alla scrittura. M, è il punto di coordi- 
nate (xy +Ax, f(x0+Ax)) in cui Ax è un incremento di x tendente a zero. Il 

coefficiente angolare della retta 1,4; è dunque Af/Ax ove Af è l’incremen- 

to f(xo+Ax) —f(xo) di f somspontine a Ax (fig. 5). La tangente 7,(xo) di (C) 
in M è di conseguenza la retta passante per M, e avente per coefficiente ango- 
lare il limite — che si scrive f'(x,) e si chiama “erivata della funzione f(x) in 
o — del rapporto Af/Ax per Ax che tende a zero. 

Se si è in grado di definire rigorosamente la nozione di limite, si è in grado 
ipso facto di definire analiticamente la nozione geometrica di contatto. Questo 
sarà il punto di vista di Newton (almeno in parte), poi di d’Alembert e, infine, 
di Cauchy e soprattutto di Weierstrass. 

2) Nell’intuizione «statica» la tangente non è definita da un processo (pas- 
saggio al limite) ma da una posizione. La tangente T;(xo) è la retta che taglia 
(C) in Min due punti infinitamente vicini. È la retta che - in un intorno 
infinitesimale di M, — si identifica con (C). Per fare «passare» alla scrittura 
questa intuizione occorre: 


a) introdurre la nozione di incremento infinitesimale dx di x; 

b) definire l’incremento infinitesimale df=f(x,+dx)-f(x) di f in x cor- 
rispondente a dx; 

c) ipotizzare che il rapporto df/dx sia definito e costante per ogni dx (ed è 
questa costanza che traduce l’intuizione che (C') è localmente indiscer- 
nibile dalla sua tangente); 

d) definire la derivata (coefficiente angolare della tangente) f'(xp) di f in xy 
come uguale a questo rapporto costante. 


Leibniz ha immortalato la definizione «statica». Si osservi che, fin dall’ori- 
gine, essa è profondamente problematica e ambivalente. Affinché sia coerente, 
occorre infatti che 1) dx non sia nullo poiché in caso contrario df/dx si ridurrebbe 
al rapporto indeterminato 0/0; e che 2) pertanto dx sia un numero, poiché in 
caso contrario non si potrebbe definire il valore di f(x+ dx), né dunque quello 
di df e di df[dx. 

Ora, come numero, dx è necessariamente nullo, il che manifesta l’ambiva- 
lenza linguistica che si è incontrata nelle definizioni «statiche» di contatto: 
«intersecare in due punti infinitamente vicini» e/o «intersecare in due punti 
coincidenti ». 


Figura 5. 


La secante. 
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Il problema sta dunque nel fatto che il « passaggio » alla scrittura dall’intui- 
zione «statica» passa attraverso l'introduzione di un supplemento simbolico 
- quello del dx leibniziano — che viola il principio d'identità e che sovverte la 
referenza. 


Inizialmente, la nozione di incremento infinitesimale è un concetto. Il 
coup de force di Leibniz è stato di «ritualizzarla» con l'introduzione di un sup- 
plemento alla notazione scritta il cui statuto è paradossale; infatti, come iden- 
tità sintattica, 1) dx è l'indice di referenti numerici nello stesso tempo arbitrari 
e impossibili, e 2) dx è il simbolo di un concetto semanticamente inconsistente. 

Per l'ideologia positivista questa aporia è sufficiente per legittimare la rimo- 
zione degli infinitesimi. Ma nella misura in cui ci si propone di mostrare che 
la forzatura leibniziana rinvia di fatto a una dimensione cruciale dell’articolazio- 
ne generale tra il simbolico e il reale, diventa necessario delineare i contorni 
del suo statuto nel modo più esatto possibile. 

Il dx leibniziano è un simbolo-indice, per dirla con Peirce, che «fissa» un 
concetto contraddittorio. È una finzione letterale che viene trattata come un 
numero. Non ha pertanto per referenza alcun numero concreto ma un po- 
sto generato dai procedimenti stessi di costruzione dei numeri. Si consideri 
infatti l'algoritmo di costruzione di N con l'operazione «successivo di» (si 
veda il citato articolo «Calcolo», p. 408). Poiché N è infinito, la sua itera- 
zione trasgredisce indefinitamente il suo limite. Ma l’algoritmo induce il po- 
sto di un numero «infinito» maggiore di tutti gli altri. Questo posto inoccu- 
pabile associato a un concetto senza referente e contraddittorio segna un cef- 
fetto de-limitante» relativo a N. Per riprendere una terminologia di Badiou 
[1969], si può chiamare infinito-punto un contrassegno supplementare che oc- 
cupa un posto inoccupabile e dipendente, per tutto ciò che non riguarda que- 
sta occupazione, dai procedimenti iniziali. L’infinito-punto è il contrassegno 
di un inaccessibile del dominio, completato da una forzatura dei procedimenti, 
che li costringe ad avere valore anche per ciò che hanno escluso. 

L’inverso di un intero «infinito» è appunto un infinitesimo. 


Di più, il dx leibniziano nel suo rapporto con la referenza è un elemento 
di codice che 1) possiede un'identità sintattica definita (poiché è una costante 
e non un simbolo di variabile), 2) si riferisce a elementi non definiti. ta 

Se malgrado tutto si volesse definire un referente concreto del dx Jeibni- 
Ziano, si sarebbe costretti a riferirsi non a un numero ma a un evento. S imma- 
gini il processo dinamico di una quantità x che si annulla: dx rappresenta l'i- 
stante in cui x si annulla, non essendo « più » un numero non nullo e non essendo 
«ancora» zero. Ma questa interpretazione non fa altro che riproporre la que- 
stione; infatti, poiché dx ha lo statuto simbolico di un numero, il suo stesso 
statuto simbolico e il suo referente nell’evento diventano da quel momento 
eterogenei. 
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In conclusione il dx leibniziano è una finzione letterale, strutturata come 
un numero, che impone un sovvertimento della referenza attraverso una sepa- 
razione fra significante e significato. 

È un infinito-punto nel senso di Badiou. È un simbolo-indice « dimezzato », 
tagliato in due, ove l’aspetto di indice e l’aspetto di simbolo sono incompatibili. 

Per il chiarimento del suo statuto logico-concettuale occorre intrecciare di- 
versi registri di analisi: quello dei posti, quello delle identità simboliche, quello 
dei referenti concreti, quello dei concetti e quello degli eventi: 


— posto: «effetto de-limitante» della costruzione di R; 

— identità simbolica: dx; 

— referenti concreti: numeri infinitesimali (inesistenti in R); 
— concetto: quantità infinitesimale (contraddittoria); 

— evento: annullarsi di una quantità. 


Prima di queste analisi occorre abbozzare in via preliminare le modalità di 
sviluppo della polemica intorno agli infinitesimi e ricordare come sono stati for- 
malmente tradotti. 


1.3. Polemiche e fondazione. 


Intorno agli infinitesimi sono venuti a convergere tutti i problemi tradizio- 
nali dell’infinito. Qualcosa è stato già anticipato; si vedrà ora meglio come que- 
sto processo storico si è chiuso grazie alla rimozione degli infinitesimi stessi. Ci 
si trova qui di fronte all’esempio più importante della spaccatura dialettica tra la 
produzione di un infinito-punto inerente alla costruzione di un reale e l’esigen- 
za della rimozione imposta dalla stabilizzazione del suo uso: una volta afferma- 
tosi, ogni metodo rimuove il suo concetto originario e ipostatizza la sua origine 
nella sua stessa produzione. Questo è, in fondo, il gioco heideggeriano della 
differenza essere/esistente: la genesi dell'esistente a partire dall’essere è affetta 
da un residuo che deve essere soggettivamente rimosso e simbolicamente preclu- 
so affinché lo stesso esistente prodotto possa autonomizzarsi come tale. Una 
volta affermatasi (ma non fondata) l’efficacia metodica del calcolo differenziale 
e integrale, si tratterà di mettere in luce la sua «impurità di origine» (Badiou). 


L'atteggiamento di Leibniz verso gli infinitesimi è una posizione formalista 
molto sottile. Privilegiando la struttura formale del linguaggio rispetto alla 
realtà della referenza, egli considera gli infinitesimi «finzioni ben fondate ». Pur 
fondando un metodo più conforme all’ars inveriendi che non i metodi di esau- 
stione di tipo archimedeo, gli infinitesimi non hanno tuttavia alcuna realtà 
effettiva. Essi non sono che «cose ideali», «finzioni utili per abbreviare e per 
parlare universalmente». 

Occorre separare qui «abbreviare» da «parlare universalmente ». Gli infi- 
nitesimi permettono davvero di abbreviare i metodi che si basano sul confronto 
di infiniti, in quanto assolutizzano il concetto relativo di approssimazione. Sotto 


Infinitesimale 452 


questo profilo, si può sempre evitare di usarli e «al posto dell’infinito o dell’in- 
finitamente piccolo, [si possono prendere] quantità tanto grandi o tanto piccole 
quanto occorre perché l’errore sia minore dell’errore dato »; e aggiungere, con 
Leibniz, «che si differisce dallo stile di Archimede solo nelle espressioni, che 
sono più dirette nel nostro metodo e più conformi all’arte di inventare ) [Leib- 
niz 1701, ed. 1962 p. 350]. In questa accentuazione del lato pragmatico della 
questione, l’essenziale è lasciato nell'ombra. 

Ma Leibniz ha anche enfatizzato l'aspetto (simbolico) che corrisponde non 
già ad «abbreviare», ma a «parlare universalmente». È qui che si manifestano 
insieme la profondità metafisica e il limite di un primato ontologico del lin- 
guaggio formale che è rimasto enigmatico fino all’analisi non standard. Per 
Leibniz infatti gli infinitesimi, benché fittizi, sono delle finzioni «fondate sulla 
realtà» che non riducono affatto la scienza dell’infinito a una finzione. Al con- 
trario: il calcolo che essi fondano è sicuro. A questa garanzia sintattica, a questa 
sicurezza formale, in breve a questa consistenza di un metodo che prende ori- 
gine tuttavia da un sovvertimento della referenza e da una spaccatura irriduci- 
bile tra significante e significato, Leibniz dà una risposta metafisica e profetica: 
«Si constata che le regole del finito funzionano nell’infinito come se ci fossero 
degli atomi (cioè degli elementi assegnabili della natura) benché non ce ne siano 
affatto visto che la materia è in realtà suddivisa all’infinito; e che viceversa le 
regole dell'infinito funzionano nel finito, come se ci fossero degli infinitamente 
piccoli metafisici, benché non se ne abbia affatto bisogno e benché la materia non 
giunga mai a particelle infinitamente piccole: ma le cose stanno cosf perché tutto 
è governato dalla ragione, e diversamente non ci sarebbero né scienza né regole, 
il che non sarebbe affatto conforme con la natura del principio supremo» [ibîd.]. 

Sarebbe ben difficile sopravvalutare questo passo. Vi si articolano chiaramen- 
te tre livelli. 

Il primo è il livello semantico (referenziale): la materia in atto è senza atomi 
e praticamente senza infinitamente piccoli (il che non è contraddittorio). 

Il secondo livello è sintattico (logico): rispetto al linguaggio — cioè rispetto 
alle regole e non alla sostanza - il finito e l’infinito sono intercambiabili. Sono 
discernibili all’interno di uno stesso punto di vista, ma divengono formalmente 
indiscernibili se si cambia punto di vista. Di qui il ruolo del «come se» che at- 
testa il primato ontologico delle regole. In breve, Leibniz relativizza l’opposi- 
zione tra finito e infinito. Una struttura infinitaria relativamente a una finitezza 
iniziale può essere nondimeno suscettibile di regole finitarie. Sul filo della me- 
tafora prospettica suggerita dal termine ‘punto di vista’, si potrebbe quasi dire 
che per Leibniz l’infinito è una «anamorfosi» del finito. 

Il terzo livello è metafisico: quello del principio «supremo» di ragione suffi- 
ciente. Questa «caduta» dell’argomentazione non è pit, per noi, molto soddi- 
sfacente. Non si potrebbe certamente più invocare un principio per sostenere 
la tesi che la ragione formale trascende la realtà. Ma si noti che, parallelamente 
a questa garanzia metafisica, Leibniz anticipa chiaramente una risposta di altro 
ordine, cioè quella della costruzione di una estensione *R di R che - contenendo 
numeri sia infinitamente grandi sia infinitesimali — sarebbe tuttavia retta dalle 
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stesse regole di R, cioè sarebbe indiscernibile da R non come oggetto concreto 
ma come substrato predicabile. 

In conclusione si può dunque affermare che Leibniz sottomette a un chia- 
sma l'evidenza naturale. Egli assolutizza la relatività dei confronti di infiniti 
(«abbreviare ») e relativizza l'opposizione tradizionalmente assoluta tra finito c 
infinito («parlare universalmente »). 


La posizione formalista di Leibniz perde ogni acutezza e ogni consistenza 
quando si ipostatizza in una posizione realista che afferma l’esistenza degli in- 
finitesimali. Questa sarà purtroppo la posizione di L’Hépital nel suo trattato 
di calcolo differenziale Analyse des infiniment petits pour l’intelligence des lignes 
courbes [1696], trattato che servî da vettore pedagogico alle idee leibniziane. 

L’Hòpital pone come assioma che due quantità che differiscono di una quan- 
tità infinitesimale sono uguali. Ora, siccome ammette pure che le estensioni dei 
numeri reali ottenute con l’aggiunta d’infinitesimi soddisfano le regole dell’arit- 
metica (principio di continuità), si trova costretto a negare la conseguenza, ba- 
nale, che x+dx=x implichi dx=o. 

Il fatto è che, parallelamente al suo chiarimento logico-concettuale, un uso 
algebrico coerente dell’infinitesimale esige che si introduca su un'estensione 
*R di R una relazione di equivalenza (essere infinitamente vicino) che sia più 
debole della relazione di uguaglianza ma che coincida coll’uguaglianza quando 
è ristretta a R. È allora necessaria un’attrezzatura formale e concettuale di cui 
all’epoca non si disponeva. Come osserva Robinson: «In realtà ciò che mancava 
a quel tempo era un linguaggio formale che avrebbe reso possibile dare una 
formulazione precisa e una delimitazione delle leggi [cioè le regole subordinate 
al ‘come se” leibniziano] che si supponeva di applicare ugualmente ai numeri 
finiti e ai sistemi estesi che includono sia numeri infinitamente piccoli sia nu- 
meri infinitamente grandi» [1966, p. 266]. 


L’evidente insostenibilità della posizione realista condusse attraverso critiche 
sia metafisiche (per esempio Berkeley [1734]) sia matematiche (per esempio 
Laplace) alla convinzione che il calcolo differenziale era di diritto utilizzabile 
solo alla condizione di fondarlo su basi differenti. Il primo difensore di questa 
nuova posizione, che privilegiò a parole il «rigore» e nei fatti la referenza, fu 
d’Alembert. E questi che introduce il centrale concetto di limite, ritornando 
all’intuizione « dinamica» dell’infinitesimale (cfr. sopra, p. 449): una quantità è 
infinitesimale se ha un limite nullo, cioè se si avvicina indefinitamente a zero. 
Ciò gli permette, a cose fatte, non semplicemente di criticare, ma di rifiutare 
l’infinitesimale: «Non ci sono affatto nel calcolo differenziale quantità infini- 
tamente piccole...; si tratta unicamente di limiti di quantità finite». «La teoria 
dei limiti è alla base della vera Metafisica del calcolo differenziale». « Noi dun- 
que non diremo, come tanti geometri, che una quantità è infinitamente pic- 
cola né prima che essa si annulli, né dopo che essa si è annullata; poiché cosa 
vuol mai dire ‘una definizione cosi falsa, cento volte più oscura di ciò che si 


vuole definire» [Alembert 1754, p. 987; 1765, p. 542; 1754, p. 987]. 
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Questa sostituzione, violenta ed esplicita, del concetto di limite a quello di 
infinitesimo, genera una rottura. Rendendo il calcolo nello stesso tempo sintat- 
ticamente e semanticamente consistente elimina la sua «impurità d’origine ) ma, 
per questa via, elimina anche gli agganci che il calcolo aveva in Leibniz con gli 
altri discorsi. Questo fatto è di grande portata epistemologica. Con d’Alembert 
il calcolo differenziale si regionalizza e si privatizza. Staccato dal terreno storico 
che lo governava si autonomizza e, epurato da ogni residuo eterogeneo, diventa 
capitalizzabile da parte del nuovo potere tecnico-scientifico. Avendo risolto il 
suo paradosso, suturato il sovvertimento della refereriza che lo assillava e sta- 
bilizzata la sua intuizione instabile, esso esclude la sua origine (cfr. sopra, p. 
451). Ciò è legittimo soltanto se si parte dalla «convinzione» che, al fine di poter 
essere adeguate alla realtà, le matematiche devono trattare degli oggetti ideali 
possibili soddisfacendo all’adeguatezza di significante-significato-referenza. È tale 
convinzione che trasforma in evidenza l'opzione ideologica di un feticismo del- 
l'oggetto e della subordinazione del «lavoro» del linguaggio a un esistente la 
cui realtà è sempre già fissata, sud specie aeternitatis. Tutto ciò è assolutamente 
all'opposto dello «stile » leibniziano che apre il campo dell’esperienza non tanto 
arricchendo i metodi (le regole del finito funzionano nell’infinito e viceversa) 
quanto sfruttando le risorse simboliche della scrittura. 

In quanto riduce all’immaginario la traduzione simbolica di uno scarto 
strutturale tra il simbolico e il reale, ci si può domandare se il «rigore» preco- 
nizzato da d’Alembert e «canonizzato» da Cauchy non segni il momento in 
cui le matematiche si legano irreversibilmente all’ideologia borghese. 


Cauchy fonda rigorosamente l’analisi non soltanto sulla nozione di limite, 
ma su un calcolo dei limiti. Ciò nonostante non elimina, come d’Alembert, gli 
infinitamente piccoli e gli infinitamente grandi, piuttosto li reinterpreta e que- 
sto gli permette di stabilire un corpus di definizioni, metodi e risultati che co- 
stituiscono ancor oggi l’essenziale dell’insegnamento dell’analisi elementare. 

Si riportano, come esempio, le sue definizioni d’infinitesimo, di continuità 
e di derivabilità: 


a) «Quando i valori numerici successivi di una stessa variabile decrescono 
indefinitamente, in modo tale da abbassarsi al di sotto di ogni numero 
dato, questa variabile diventa ciò che si chiama un infinitamente piccolo 
o una quantità infinitamente piccola. Una variabile di tal specie ha per 
limite zero» [1821, ed. 1897 p. 19]. 

b) Una funzione f : R+R è continua in un intervallo «se, tra questi limiti, 
un incremento infinitamente piccolo della variabile produce sempre un 
incremento infinitamente piccolo della funzione stessa» [ibid., p. 43]. 

c) Una funzione continua f : R+R è derivabile in x se il rapporto di in- 
finitesimi df/dx ha un limite quando questi tendono a zero. 


In quest’ultima definizione, df/dx potrebbe essere sostituito col rapporto 
delle differenze finite Af/Ax. Robinson osserva al proposito: «Sembra ragio- 
nevole concludere... che secondo Cauchy una funzione non raggiungeva il suo 
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limite direttamente, ma solo attraverso espressioni che comportano infinitesi- 
mi» [1966, p. 274]. 

Cauchy rifiuta il «parlare universalmente » leibniziano, cioè il principio for- 
malista di continuità secondo il quale gli infinitesimi soddisfano le regole dei 
numeri ordinari: «Per quanto riguarda i metodi, ho cercato di dare loro tutto il 
rigore richiesto nella geometria in modo da non ricorrere mai ai ragionamenti 
tratti dalla genericità dell’algebra» [Cauchy 1821, ed. 1897 p. 11]. La sua «ade- 
renza» all’intuizione dell’infinitesimale è dunque in Cauchy «un non sequitur 
“logico” e si può dire che comporta un uso inconscio del ‘principio di conti- 
nuità””, la cui applicazione egli stesso aveva criticato » [Robinson 1966, p. 275]. 

L’uso del termine ‘inconscio’ da parte di Robinson è pertinente. Tutto ac- 
cade infatti come se, qualunque siano le sue ri-problematizzazioni, la nozione 
di infinitesimo restasse concettualmente pregnante. Da Cauchy, la situazione 
non è evoluta di molto. Non si deve dimenticare, infatti, che — contrariamente ad 
altri «lessici», caduti nella dimenticanza — quello infinitesimale appartiene an- 
cor oggi alla pratica matematica più quotidiana. 

È sufficiente d’altronde questa sola ragione pragmatica a giustificare un me- 
todo che ne fonda l’uso. Come osserva Robinson, «è vero che molte opere clas- 
siche di Geometria Differenziale sono state fatte nei termini di una vaga no- 
zione di infinitesimi, e la stessa cosa vale per la Meccanica Analitica. General- 
mente si crede che tutto questo lavoro potrebbe, se necessario, essere riscritto 
conformemente al rigore della matematica contemporanea, ma nessuno intra- 
prenderebbe mai nei dettagli un compito del genere. Non è senza interesse il 
fatto che oggi possiamo giustificare direttamente l’uso degli infinitesimi in 
tutti questi problemi» [1961, p. 437]. 


Dopo Cauchy, si deve essenzialmente a Weierstrass e al suo metodo «e—3» 
(anticipato da Bolzano) la rimozione definitiva dell’infinitesimale. Si consideri 
per esempio la sua definizione (ormai standard) della continuità: « f(x) è con- 
tinua in x, se per ogni e>o arbitrariamente piccolo esiste un n>o tale che 
lx — x <n) implica |f(x)--f(xo)]<e». Non si fa più ricorso al lessico infinitesi- 
male. Ma se questa definizione evita gli infinitesimi non solo come infinito at- 
tuale, ma anche (come in Cauchy) come infinito potenziale, è perché fa impli- 
citamente ricorso a R come totalità (a causa della quantificazione «per ogni e» 
e «esiste un n»), cioè a R come infinito attuale. 

Dopo Weierstrass, i concetti fondamentali dell'analisi sono stati formulati 
nel suo stile. 


Poiché il paradosso dell’infinitesimale è — apparentemente - un aspetto del 
paradosso generale dell’infinito attuale e siccome quest’ultimo è stato risolto 
da Georg Cantor, non è senza interesse, per concludere questo excursus sto- 
rico, ricordare la posizione di Cantor a riguardo dell’infinitamente piccolo. 

È noto (cfr. anche l’articolo «Infinito» in questa stessa Enciclopedia) che 
con l’introduzione del concetto di ordinale transfinito Cantor riesce a distin- 


guere nell’infinito due nozioni identiche nel finito: quella di cardinale (poten- 
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za) e quella di ordinale (tipo di un insieme bene ordinato). Approfondendo la 
distinzione fra l’infinito potenziale (che chiama «infinito impropriamente det- 
to») e l’infinito attuale (che chiama «infinito propriamente detto») Cantor ro- 
vescia il dogma aristotelico «infinitum actu non datur»: «Ma se si prendono 
in considerazione le ragioni che avanza Aristotele contro l’esistenza reale del- 
l'infinito (cfr. la sua Metafisica, XI, 10), queste possono essere riportate essen- 
zialmente a un presupposto che implica una petizione di principio: non ci sono 
che numeri finiti; e deduce ciò perché conosce soltanto numerazioni per i siste- 
mi finiti. Credo tuttavia di avere dimostrato... che si possono praticare numera- 
zioni determinate per tutti i sistemi, sia finiti che infiniti, alla condizione di im- 
porre ai sistemi stessi una legge determinata che ne fa dei sistemi dere ordinati... 
Emerge qui, come una proprietà particolare dei sistemi finzti, che il risultato 
della numerazione, cioè il numero ordinale, è indipendente dall'ordinamento ef- 
fettuato all'occorrenza, mentre per i sistemi infiniti una tale indipendenza non 
si presenta in generale... è precisamente qui e solo qui che si colloca la diffe- 
renza essenziale fra il finito e l’infinito, differenza certo fondata in natura e che 
per questo non dovrebbe mai essere dimenticata in nessun modo; tuttavia si 
potrà, in nome di questa differenza, negare l’esistenza dell’infinito e mantenere 
quella del finito: se si fa cadere l’una ci si deve necessariamente sbarazzare 
dell’altra; ma per questa via dove arriveremo?» [Cantor 1883, PP. 554-55]. 

Ci si può stupire che Cantor, pur avendo una visione cosi acuta della co-im- 
plicazione del finito e dell'infinito, rifiuti tuttavia gli infinitesimi senza osser- 
vare che, a parte le differenze storiche, la forzatura leibniziana è dello stesso 
ordine di quella che egli stesso tenta di giustificare: primato ontologico di un 
lavoro del simbolico su una realtà sempre già costituita. In realtà la sua posi- 
zione è abbastanza sottile e in ogni caso non dogmatica: 1) in analisi (Cauchy- 
Weierstrass) l’infinitesimale è un infinito impropriamente detto (un limite); 2) 
i tentativi di definire l’infinitesimale come infinito propriamente detto sono fal- 
liti; 3) tale definizione può tuttavia essere possibile, ma in futuro. 

«Si porrà forse... il problema seguente: dal momento che in questo modo 
[con la teoria dei transfiniti], si ottiene per il dominio dei numeri reali una 
estensione determinata verso l’infinitamente grande, non si potrebbero definire 
con lo stesso successo numeri determinati infinitamente piccoli o, il che è lo 
stesso, dei numeri finiti che non si confondano coi numeri razionali o irrazio- 
nali..., ma che potrebbero essere introdotti tra i numeri reali in ipotetici posti 
intermedi? La questione della costruzione di tali interpolazioni, per la quale 
alcuni autori si sono dati molta pena, non può... ricevere risposta chiara che gra- 
zie ai nostri nuovi numeri e più precisamente sulla base del concetto generale 
di numerale di insiemi bene ordinati; al contrario i tentativi precedenti, per 
quanto so, da una parte si basano su una confusione errata tra l’infinito impro- 
priamente detto e l’infinito propriamente detto e dall’altra sono stati condotti 
su una base completamente incerta e barcollante... Le grandezze infinitamente 
piccole, per quanto io sappia, sono state utilmente sviluppate fino ad oggi 
soltanto sotto la forma dell’infinito impropriamente detto... Al contrario tutti 
i tentativi tendenti a trasformare con un coup de force questi infinitamente pic- 


457 Infinitesimale 


coli in infinitamente piccoli propriamente detti, dovettero essere infine abban- 
donati e se ne dovette ammettere la vanità» [ibid., p. 551]. 

E Fraenkel, discepolo di Cantor, scriveva ancora nel 1928: « Messo alla pro- 
va, l’infinitamente piccolo ha completamente fallito ». Ma aggiungeva: « Certo è 
concepibile (anche se con buone ragioni lo si può giudicare inverosimile e ri- 
mandare a un lontano futuro) che un secondo Cantor dia un giorno un fon- 
damento aritmetico incontestabile a nuovi numeri infinitamente piccoli, che si 
rivelino utilizzabili in matematica e che possano forse aprire una via più sem- 
plice al calcolo infinitesimale. Ma finché non si sarà fatto qualcosa del genere... 
bisognerà attenersi all'idea che in nessun modo si può parlare di esistenza 
matematica — dunque logica — degli infinitamente piccoli, in un senso identico 
o analogo a quello che si dà agli infinitamente grandi» [1928, pp. 1x6-17]. 

proprio il «concepibile-inverosimile» evocato da Cantor e Fraenkel che 
l’analisi non standard realizza. 


1.4. La reinterpretazione della notazione differenziale. 


Rifiutare gli infinitesimi non significa evidentemente rifiutare il calcolo dif- 
ferenziale e integrale. Anzi. Si è dunque giunti a reinterpretare la notazione 
leibniziana che ne era la pietra angolare. 


Per quanto riguarda il simbolo dx che interviene negli integrali ff(x) dx, 
esso è stato reintrodotto nella teoria insiemista della misura fondata all’inizio 
del secolo da Lebesgue, Kolmogorov, Radon e dalle loro scuole. Per questo 
aspetto della questione si rimanda ad altri articoli di questa stessa Enciclopedia. 


Per quanto riguarda la notazione differenziale la sua traduzione si opera nel 
modo seguente (si veda anche l’articolo « Differenziale» in questa stessa En- 
ciclopedia). 

Sia f:R*+R una funzione reale di n variabili reali x,, ..., x,. Si supponga 
che f ammetta derivate parziali df/dx,, ..., df/dx, in x°eR®. In notazione infi- 
nitesimale, se i dx; sono incrementi infinitesimali degli x; e se df è l'incremento 
infinitesimale corrispondente, sa e i dx; sono legati dalla formula fondamentale 


O dtt 


(0) dx, 
che si tratta di reinterpretare. 

Ciò si fa in diverse tappe. x° sia l’origine O di R® e si cominci col definire 
la nozione di vettore tangente a R” in O. Intuitivamente (cfr. anche la figura 
6) un vettore X tangente a R" in O è il vettore velocità in O di una traiettoria 
y(t) di R” passante per O, per esempio per #=0, e differenziabile in o. 
Siccome Y(t)=(x1(t), ..., xn(t)), le coordinate X; di X sono date da 


dx, 
2 X;>=—- 
( ) ‘ dt 10 
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Sia allora f : R*+R una funzione derivabile in O. La sua restrizione a Y 
è una funzione di #, f(y(t)), di cui si può calcolare la derivata in # per t=0 
con la regola di derivazione delle funzioni composte: 


o) I EC 
(3) di \io OS di Masio e? Re 
ossia, per la (2), 

df df 
(4) ar iron 


Questa formula permette di definire lo spazio — indicato con ToR*: spazio tan- 
gente a R” in O — ove «abitano» i vettori tangenti a R” in O. Si può infatti 
identificare X con l’operatore di derivazione 


(5) X=), ida; 


che associa a ogni funzione f : R"+R derivabile in O il vettore 
x(f)=Y xp f 
i=1 ‘dx; A 


(derivata di f relativamente a X). X è un operatore lineare che soddisfa la for- 
- mula del prodotto: 


(0) X(S8) =SX(£)+8X(f). 


In breve, 7oR” è lo spazio vettoriale di dimensione n di base d/dx,, ... 
d/dx n, determinata dalla scelta delle coordinate (1, + xp) di R”. . . 

Si indichi con 7 lo spazio vettoriale To R° e sia 7* il suo duale, cioè lo spazio 
vettoriale delle forme lineari reali su 7° (si veda l’articolo «Dualità» in questa 
stessa Enciclopedia). ea tia VEE 

Si indichi con dx; l'applicazione di 7 in R che associa all'operatore di deri- 
vazione d 


n 
X=)\ X—_ 
fonte . . fi ‘dx 
la sua i-esima coordinata X;: 


(o da()=X 


y(6) 


Figura 6. 
Vettore tangente. 
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È banale verificare che dx; è una forma lineare su 7, dunque un elemen- 
to di T*. 
Sia pe T* e si indichi con @; il numero 
ò 
(8) vo(3). 


dx; 


n 
Se xs è un vettore di 7, si ha 


;=1 ‘dx; 
x)-Vx °) 
®( Ex Oa e 
n 


=) X0;= dalla (8) 
1 
n 

=) pda, dalla (7). 
i=1 


T* è dunque uno spazio vettoriale di dimensione n, di base dx,, ..., dx, deter- 
minata dalla scelta delle coordinate x,...x, di R”. Relativamente a questa base 
le coordinate di uno dei suoi elementi @ sono date dalla (8). 

Sia allora f : R”-R una funzione derivabile nell’origine, Si indichi con df 
l'applicazione di T in R che associa al vettore 


xeyxÈ 
di 7 il numero 


O) IMAA. 
df è un elemento di 7* e si ha dalla (17) 
di R)=Y IE de) 
e quindi ; 
Gc) dia 


cioè la formula (1). 

In questa «traduzione» che lascia invariate le formule ma che trasforma lo 
statuto delle entità che esse collegano, il differenziale df non è più un infinite- 
simo ma una forma lineare sullo spazio degli operatori di derivazione in O. 


La descrizione che precede è locale (ristretta a un intorno «infinitesimo» 
di O). Ciò che è stato indicato con df dovrebbe essere indicato con df(0), dif- 
ferenziale di f in O. 

Se f è ovunque derivabile in R”, si può globalizzare. Si definirà il piano 
tangente TyR” a R* in x, il suo duale — detto piano. cotangente — (TxR?)* e 


17 
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il differenziale df(x) di f in x. Siccome si possono «incollare» i piani tan- 
genti (rispettivamente cotangenti) in uno spazio globale TR” (rispettivamente 
T*R") - detto fibrato tangente (rispettivamente fibrato cotangente) — fibrato 
su R® con una proiezione x : TR"+R" (rispettivamente x : T*R"?+R") che 
associa a un vettore tangente (rispettivamente cotangente) a R* la sua origi- 
ne, si vede che, in ultima analisi, il differenziale df di una funzione f : R°+R 
è quello che si chiama una sezione del fibrato cotangente, cioè un’applicazione 
df : R"+T*R” tale che rodf=1R" (IR” è l'applicazione identica di R"). A 
xcR", df associa la forma lineare df(x) su 7xR”. 

Si è ben lontani dal df come infinitesimo. l 

Di fatto questa globalizzazione ha interesse soltanto se non si considera 
più uno spazio R” ma uno spazio ottenuto « incollando» carte locali identi- 
ficabili con «pezzi» di R”. Per costruzione, questi spazi — detti varietà diffe- 
renziabili — sono localmente identici a R” ma in generale globalmente diffe- 
renti (si veda l'articolo «Curve e superfici» in questa stessa Enciclopedia). Nel 
caso di R" il concatenamento dei livelli «degenera» poiché 1) tutti gli spazi 
tangenti Ty" sono canonicamente isomorfi a R": un vettore tangente a R” 
«è y un vettore di R*, o ancora il fibrato tangente TR” «è» il prodotto diretto 
R"xR"; 2) la struttura euclidea di R” implica un isomorfismo canonico tra 
TR?” e T*R?., Il differenziale df si riduce dunque a un campo di vettori di R" 
- detto campo di gradienti di f - che associa a xe R" il vettore di R* di coordi- 


nate (df/dx,, ..., df/dxn). 


1.5. L’infinitesimale leibniziano come finzione. 


Prima di mostrare (cfr. il $ 2) come l’analisi non standard chiarisca lo sta- 
tuto aritmetico e algebrico dell’infinitesimale leibniziano e come dia consi- 
stenza alla dubitativa anticipazione di Cantor (cfr. sopra, p. 456), se ne spiega 
preliminarmente lo statuto logico-concettuale. 

Si riconsiderino le conclusioni di p. 451: prescindendo da ogni feticismo 
dell'oggetto (cfr. sopra, p. 454), si tratta di dedurre le proprietà logico-concet- 
tuali «anormali» del dx leibniziano: 


a) è un’identità simbolica che occupa un posto inoccupabile con un «effetto 
di de-limitazione» per i procedimenti di costruzione dell’insieme R (in- 
finito-punto); 

b) è un simbolo-indice « dimezzato» in cui l’aspetto di indice e l’aspetto di 
simbolo sono incompatibili; 

c) è un significante di cui ogni referente nega il significato; 

d) è un simbolo letterale che ha lo statuto sintattico di un numero ma che 


si riferisce a un evento. i 


Si tratta di iscrivere nel quadro stesso della logica formale questa finzione 
e la spaccatura che essa materializza. Si può, d’altronde, ipotizzare che questo 
scarto tra concetto e logica è universale: l’infinitesimale non ne sarebbe che l’e- 


sempio matematico più rilevante. 
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Questo significa — nella misura in cui esige un controllo logico-concettuale 
della contraddizione — che un chiarimento di questo ordine non può basarsi 
che su una formulazione non classica della logica elementare. i 

Per una tale presentazione ci si varrà di alcune idee di Hilbert. 


._ Per dimostrare la consistenza dell’aritmetica, Hilbert pensava di poter uti- 
lizzare una strategia finitista e aveva approntato a tal fine un gi elimi- 
nazione dei quantificatori. Poiché le sue speranze sono state spazzate via dal 
teorema di Gédel, tale metodo, divenuto inutile, è caduto in discredito. Benché 
talvolta utilizzato ancora in modo sporadico (per esempio da Bourbaki nelle 
sue prime pagine), esso non è più che una curiosità storica del «museo im- 
maginario ) matematico. T'uttavia, come si vedrà, tale metodo permette in modo 
molto economico di spiegare lo statuto logico-concettuale dell’infinitesimale 
Hilbert sosteneva la tesi che per «fondare» le matematiche occorresse di- 
mostrare la loro consistenza formale — e innanzitutto la consistenza dell’arit- 
metica — facendo uso soltanto di una metalogica finita, l’unica che poteva venir 
considerata come legittima a priori. Ciò pone un immediato problema relativo 
alla quantificazione, Finché ci si attiene a insiemi finiti, gli enunciati quantifi- 
cati sono equivalenti a disgiunzioni o congiunzioni finite di enunciati elemen- 
tari. Se per esempio F(x) è un predicato il cui dominio di definizione è l’in- 
sieme finito A={a,, ..., a,}, l’esistenziale Tx F(x) è equivalente alla disgiun- 
zione finita F(a))V...VF(a,): a, soddisfa F, o a, soddisfa F, o ecc.; e luni. 
versale VxF(x) alla congiunzione finita F(a,)) A... AF(a,): a ea e ea 
soddisfano F. Le cose vanno diversamente se A è infinito. Quantificare su un 
insieme infinito non è più un processo finitista e non può più, per Hilbert 
sta accettato a priori. Occorre dunque essere in grado di eliminare i quan- 
n e dagli assiomi delle teorie di cui ci si propone di dimostrare 
Eliminare i quantificatori non vuol dire vietarli; in tal caso infatti ci si 
confinerebbe in una logica troppo povera. Vuol semplicemente dire che essi 
non devono pit essere considerati come nozioni logiche primitive ma al con- 
trario che bisogna derivarli nel quadro di un formalismo che soddisfi le con- 
dizioni restrittive di una strategia finitista. 
; La principale fra queste condizioni restrittive è quella che impone di limi- 
arsi a manipolazioni logiche elementari su enunciati elementari di tipo F(a) 
»(a, b), ecc. Poiché il procedimento di Hilbert è puramente sintattico, i sim- 
boli di individui a, b, ecc. non hanno né condizioni restrittive maniche né 
condizioni restrittive referenziali. Ciò consente a Hilbert di optare per una 
strategia di estensione dell’universo degli oggetti. Per ogni predicato in o- 
sto F(x) egli introduce — in modo puramente sintattico - un simbolo indi. 
cito con e,F(x) (che si noterà qui ey per comodità) in cui x diventa una 
variabile vincolata. Tale e-termine ex è un simbolo di individuo e non un sim- 
bolo di variabile: rappresenta l’idea di un individuo che soddisfa F 
Hilbert definisce allora il quantificatore esistenziale con l'equivalenza: 


(11) dxF(x)=F(cp). 
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L'affermazione ‘Esiste un elemento che soddisfa F° equivale all’altra Too 
viduo ideale che rappresenta l’idea di un individuo che soddisfa F, soddisfa 
effettivamente P°. na . pisai 

Si osserverà che in questa definizione — chiave di volta del metodo hilber 
tiano — un enunciato complesso (quantificato) viene sostituito da un enunciato 
elementare il quale attesta che un determinato individuo soddisfa una deter- 
minata proprietà. . : 

Ora se F(x,y) è un predicato a due posti, e,F/(x,y) è pn predicato i po 
sto, con y variabile libera. È dunque possibile formare ] e-termine eye, (x,9), 
ecc. Siccome la quantificazione universale si riporta per negazione alla quan- 
tificazione esistenziale, si possono in tal modo eliminare i quantificatori con 
aggiunta di e-termini. pot 

Sitilbert considera allora il calcolo C., usualmente detto e-calcolo, costituito 
dalle parti seguenti: 


a) calcolo delle proposizioni (simboli di I» di proposizioni e operatori 
logici di congiunzione A, disgiunzione V, negazione -); 

5) simboli di individui e simboli di variabili; 

c) simboli di predicati a n posti; 

d) e-termini corrispondenti; 

e) regole standard di deduzione; 

f) regola d’introduzione dell'operatore e: 


(12) F(a) = F(er): 


poiché F è un predicato a un posto, se si è dimostrato che un 34 
particolare, a, soddisfa F, si può introdurre l’e-termine ep e porre (e s} 
Per la (11) questa regola non è nient altro che la dee € 
regola classica d’introduzione del quantificatore esistenziale. 


(13) F(a) > IxF(x). 


Quantunque non contenga esplicitamente quantificatori, C. è, per la (11), 
una estensione del calcolo dei predicati CP. Ma... 


CP + 


Deduzione Deduzione 
ti È 
diretta in CP ti in C. 


—————__ + 
non contiene e | 

Figura 7. 

Schema del teorema di Hilbert. 
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TEOREMA (Hilbert). C. è una estensione inessenziale di CP. Ciò significa che 
se © è una formula di CP e V una conseguenza di @ in C., se il simbolo e non in- 
terviene in modo irriducibile in V, allora è una conseguenza di © în CP. (Cfr. 


fig. 7). 


Questo risultato è di grande importanza perché mostra che i calcoli C7 © 
C, sono sintatticamente equivalenti e che dunque non c’è alcuna ragione dii 
privilegiare l’uno in rapporto all’altro. 

Ma se CP e C, sono sintatticamente equivalenti, le loro semantiche naturali 
sono al contrario molto differenti e in particolare per quanto riguarda il problema 
della referenza. 

La semantica del calcolo dei predicati CP è infatti puramente estensionale. 
I «nomi» a, bd, ecc. degli individui sono in essa arbitrari e la quantificazione 
viene interpretata in termini di «prospezione». Al contrario in C. la quantifi- 
cazione (esistenziale) s’interpreta come una proprietà di consistenza di un in- 
dividuo ideale, di una identità simbolica. Tradizionalmente, si considera l’ope- 
ratore di Hilbert come un operatore di scelta: poiché l’e-termine ey rappresen- 
ta, secondo il concetto, l’idea di un elemento che soddisfa F e, secondo il 
referente, un elemento arbitrario che soddisfa F° , Se Xp è l'insieme degli cle- 
menti che soddisfano F, si può dire che l'operatore e seleziona un elemento 
arbitrario a di Xy come referente di ep. Se F(e r) è valido, allora F(a) è valido, 
a soddisfa F, Xx è non vuoto ed esiste certamente un elemento che soddi. 
sfa F. 

Tuttavia si vede che se l'equivalenza fondamentale (11) è consistente, ciò 
non è che a causa dello statuto logico-sintattico ben preciso degli e-termini. 
I postasi di idee, gli e-termini sono nello stesso tempo dei simboli secondo il con- 
cetto e degli indici secondo il referente. Elementi di codice determinati il cui 
referente è indeterminato, si può dire che essi sono strutturati come simboli-in- 
dice. Proprio a questa intrusione metodica nel campo della logica formale di 
entità che hanno lo statuto «linguistico» di simboli-indice, l'operatore hilber- 
tiano deve la sua portata epistemologica. 

Si prenda allora in considerazione una proposizione universale di tipo 
VxF(x). Denotando —F con f, si hanno le equivalenze 


VxF(x)=-HxF(x) (dualità VeH tramite la negazione) 
(14) IwF@a)=F(cp) (per la (11)) 
nIxF(x)= <F(en) 
‘, poiché nÈ=F, 
(15) VaF(x)=F(cp). 
Si supponga che VxF(x) sia valido in una interpretazione data. L’e-ter- 
mine ep, detto quindi termine-zero (null term), esiste sempre per ipotesi ma 


possiede uno statuto molto particolare. Siccome non esistono elementi che su 
diufano È, ep è infatti proprio un simbolo-indice senza referente consistente. Ln 
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(15) esprime che ogni referente di ep nega il significato n re Aa 
significante. Un termine-zero è dunque un simbolo-in o d- È i 
cui l’aspetto di simbolo e l’aspetto di indice sono incompatibi i, è la e o 
terale di una disgiunzione tra significante e significato, una finzione che imp 
imento della referenza. n. 

é Duce di Hilbert rende in un certo senso la Li 
operatoria. Mostra che a livello logico-concettuale ogni universale è » di = 
da un «effetto paradossale ». E siccome per il teorema di Hilbert i calcoli 2 
e C. sono sintatticamente equivalenti, questi effetti parassitari, ii « LAN 
rità di origine», non sono eliminabili che attraverso una censura ideologica 
privilegia l’interpretazione estensionale della logica elementare. A Ò 

Introducendo la nozione intuitiva di «posto » è possibile approfondire qu 

1: . - x 
“ cl Tx F(x)=F(cp) esprime che il dd Ep cu 
lizzato «al suo posto», cioè che va nel posto determinato dal predicato F c 
gn VxF(x)=F(ep) esprime al contrario che il A 
dimezzato ep è delocalizzato, che esso «non è al suo posto» 0 o È 
«catturato» dal posto del predicato stesso che lo nega. agri all’in di 
pretazione «statica» di un termine-zero come disgiunzione Sw e 
ficato, esiste un’interpretazione « oa » che ne fa la traccia letterale di 
ideale di delocalizzazione o di biforcazione. NEGRI 1 

i dunque sostenere la tesi che, malgrado la sua nico pai 
smo hilbertiano è «fondato nella realtà» e materializza nel campo lai ‘cla 
l’eterogeneità tra il simbolico e il reale che è inerente al concetto. + 
della referenza consiste nel banalizzare nell'immaginario ciò che esso pi i 
di fittizio una volta interpretato, laddove, al contrario, esso iscrive al livello 
logico-simbolico il funzionamento dialettico naturale del concetto. 


Si torni ora all’infinitesimale e si prenda in considerazione l’enunciato F(0): 
(16) F(0) = Vy(y#0 > Hr (r>on[y|>?)) 


che, una volta interpretato in R, significa che non O e - 
(16) asserisce infatti che per ogni numero reale y non nullo ci di Se 
ro reale positivo 7 tale che |y|>r (cioè, y è separato da ° da so ” » 
ta). F(0) ha la forma VyG(y) S dunque per la (15) è LA cd ùi su: 
Si prenda dunque in considerazione il termine-zero eg. Poiche 


A > B, G sarà di forma ANB: 
(17) 69) = (ro) AYr(r>o => blsr). 


eg rappresenta dunque l’idea di un numero differente da o la cui distanza da 
o è minore di qualunque numero strettamente positivo. Ma questa è proprio ia 
definizione dell’infinitesimale leibniziano. Di qui: è 


(18) dx=eg. 
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Non deve dunque stupire che si siano individuati a proposito del dx leibni- 
ziano tutti i tratti caratteristici di un termine-zero. In particolare l’interpreta- 
zione di d’Alembert dell’infinitesimale in termini di evento (cfr. sopra, p. 453) 
non fa che metaforizzare in modo «fisico» l’evento di biforcazione attraverso 
cui il termine-zero dx non è strutturalmente al suo posto (delocalizzazione). 


Una volta che si disponga della finzione dx, l’universale (16) equivalente 
a G(eg) si traduce con: 


(19) dezo > Tr (r>o A |dx|>r): 


ogni infinitesimale è o nullo o finito. E questo già si sapeva. 


Osservazione: Ciò che precede potrà apparire circolare. Tuttavia non si tratta 
che di materializzare una de-limitazione di R come totalità. Ma non solo l’idea 
paradossale di infinitesimale è, come si è visto, un effetto logico-concettuale 
dialettico e pregnante eliminabile soltanto con una censura ideologica; tale idea 
permette anche di esprimere concettualmente una proprietà strutturale fonda- 
mentale di R con l’enunciato negativo «Non esistono infinitesimi». 

Il problema delle determinazioni concettuali negative è senza dubbio cru- 
ciale. La sua archeologia porterebbe molto lontano, senz'altro fino al pensiero 
selvaggio. Come predicare una totalità per cui non si dispone di un procedi- 
mento effettivo di costruzione? L’interesse dell’operazione hilbertiana starebbe 
nell’aver mostrato che enunciati negativi che prescindono dall'esistenza (come 
esige îl loro concetto) di entità contraddittorie equivalgono a enunciati quantifi- 
cati positivi. Evidentemente, dal momento in cui si è avuta a disposizione una 
costruzione esplicita di R come infinito attuale, ci si è potuti dispensare da ogni 
ricorso all’infinitesimale. Ma occorre aver ben chiaro che, facendo ciò, l’analisi 
si è separata irreversibilmente da ogni terreno ontologico, si è privatizzata e 
capitalizzata tecnicamente (cfr. sopra, p. 454); essa partecipava infatti della 


dialettica universale interna al concetto solamente grazie alla struttura del ter- 
mine-zero. 


Se la determinazione del dx come termine-zero chiarisce il suo statuto lo- 
gico-concettuale, tuttavia consente anche di mediare la spiegazione del suo sta- 
tuto aritmetico e algebrico. Se infatti dx è un termine-zero, lo è solo relativamen- 
te a R. Dunque si può sfruttare la disgiunzione che esso fissa fra significante e 
significato per trovargli un referente (in modo consistente) all’«esterno» di R. 
Si ottiene cosi per saturazione delle operazioni una estensione *R di R. Se ora 
è possibile convalidare il principio di continuità mostrando che — salvo ad ar- 
ricchire *R —- R e *R sono in qualche modo equivalenti, si sarà condotti, co- 
me Leibniz, a relativizzare l'opposizione finito /infinito. Relativamente a R, dx 
nurà un termine-zero, ma relativamente a *R sarà un segno (coesione signifi- 
cunte/significato). F(0) (si veda la (16)) sarà valido in *R per il fatto che è va- 
lilo in R: non ci sono infinitesimi assoluti, ma solo relativi. Se si quantifica 
si R per definire dx (si veda la (18)), dx può trovare un referente (in modo con- 
sixtente) in *R. Se si quantifica su *R per definire dx, allora dx ridiventa un 
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simbolo-indice « dimezzato », inconsistente relativamente sia a R sia a *R, e che 
inoltre ha un referente solo in una estensione **R di *R. Si può dunque antici- 
pare la struttura di una estensione non standard *R di R; resta, ovviamente, il 
problema di mostrare che un’estensione del genere esiste effettivamente. 

*R deve essere ottenuta a partire da R per aggiunta di infinitesimi e per 
saturazione delle operazioni: sarà dunque costituita da tre componenti: 1) l’in- 
sieme R dei numeri reali, detti, per tale occasione, standard; 2) un insieme 4 
di infinitesimi che contiene solo o come numero standard; dx è il suo simbolo- 
indice; 3) l'insieme R., dei numeri «infiniti»; sono gli inversi degli infinitesimi. 

Data l’invarianza per traslazione di R, la parte finita di *R, *R,= *R\ R, 
sarà ottenuta associando a ogni xeR l’insieme u degli infinitesimi: *R, è 
«fibrato» su R di fibra in x: l'insieme x+y ha come simbolo-indice x+dx 
(fig. 8). 

*R deve essere «indiscernibile» da R, cioè deve possedere esattamente le 
stesse proprietà di R purché queste siano esprimibili in un certo linguaggio di 
base. In particolare *R sarà, come R, un corpo ordinato «archimedeo ». Ciò non 
è contraddittorio col fatto che esistono numeri «infiniti» in *R (col fatto cioè 
che *R non è archimedeo nel senso stretto del termine). Questo significa che 
*R è archimedeo non relativamente a N, ma relativamente a *N, insieme degli 
interi di R che comprende interi «infiniti». 

Ogni entità definita a partire da R deve essere automaticamente (cioè in 
virtà della stessa costruzione di *R) prolungabile a una entità dello stesso or- 
dine definita a partire da *R. 

È un programma di tal genere che ha portato a termine l’analisi non stan- 
dard. Come afferma Fenstadt: «Leibniz era dell’idea che gli infinitesimi e il 
loro calcolo potessero essere giustificati con l'introduzione di un tipo di ele- 
menti ideali che potevano essere o infinitamente piccoli o infinitamente grandi 
rispetto ai numeri reali. Ma Leibniz e i suoi successori, in particolare L’Hòpi- 
tal, non erano in grado di sviluppare in modo consistente un’analisi basata su 
queste idee. L'introduzione di *R realizza invece tutto ciò, *R è un’estensione 
elementare di R che possiede le stesse proprietà aritmetiche. E la teoria evita 
le difficoltà connesse con il tentativo di Leibniz, distinguendo accuratamente 
ciò che ‘'è uguale” da ciò che ‘è infinitamente vicino a”. Per un infinitesimo 
dx e un corrispondente dy, abbiamo f'(x)> (dy/dx) cosi che f'(x)=st(dy[dx), 
laddove Leibniz voleva avere f'(x)=dy/dx, che è chiedere troppo» [1968, pp. 


39-40]. 


dx x+dx 


Figura 8. 
Schema: la parte finita di *R. 
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Ma l’analisi non standard ha potuto condurre a termine tale programma solo 
basandosi in modo essenziale sul rapporto che sussiste tra R e il linguaggio 
formale in cui vengono espresse le sue proprietà. Lo studio di tale rapport» tra 
sintassi (linguaggio formale) e semantica (struttura concreta) è noto in logica 
sotto il nome di teoria dei modelli. i 


2. Elementi di teoria dei modelli. 


2.1. La dialettica sintassi/semantica. 


La teoria dei. modelli analizza i rapporti esistenti tra una struttura mate- 
matica concreta e la sua teoria (nel senso formale del termine), cioè la struttura 
dell'insieme degli enunciati che essa soddisfa. La teoria dei modelli si poggia su 
una dialettica sintassi/semantica dove la sintassi rappresenta la parte linguistica 
e formale e la semantica la parte insiemista e concreta. 

Si consideri per esempio il corpo R dei numeri reali che si suppone costruito 
esplicitamente come infinito attuale: viene inteso come un oggetto concreto. 
Quando poi si dice che R è un corpo topologico commutativo, totalmente or- 
dinato, archimedeo e completo, si dice con questo che tale oggetto concreto è 
dotato di una particolare struttura, anzi, di più strutture tra loro combinate: 
1) di una struttura algebrica definita dalle operazioni di addizione (+) e di mol- 
tiplicazione (-); 2) di una struttura di ordine definita dalla relazione d’ordi- 
ne <; 3) da una struttura topologica ©. 

Come struttura, R è dunque la quintupla 


R=<KR, +, <, ©). 


. Ora, siccome non c’è intuizione che permetta di conoscere questa struttura 
in modo immediato, per comprenderla si deve spiegarne in modo mediato 
(cioè con l'ausilio di dimostrazioni) la descrizione predicativa. Si parte da 
proprietà date per acquisite per giungere, attraverso un certo itinerario dedut- 
tivo, ad altre proprietà. Ma poiché la deduzione è puramente sintattica e algo- 
ritmica si devono prima tradurre in un linguaggio formale appropriato gli 
enunciati presi in considerazione. Si introduce cosf una distinzione tra linguag- 
gio formale e struttura concreta, cioè tra sintassi e semantica. 

In altri articoli della presente Enciclopedia sono trattati gli aspetti specifici 
della formalizzazione, del calcolo logico, della deduzione. Qui, per «parlare» 
So strutture, verrà brevemente delineato il linguaggio L dei predicati compo- 
sto da: 


a) un insieme numerabile di simboli di variabile, x, y, £, ecc.; 

b) un insieme numerabile di costanti a, d, e, ecc. che consentono di designa- 
re degli elementi strutturalmente distinti come o, I, ecc.; 

c) il simbolo di uguaglianza; 

d) un insieme numerabile di simboli di relazioni (unarie, binarie, ternarie, 
ecc.) F, G, P, O, ecc., che possiedono ciascuna una arietà definita; 
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e) eventualmente un insieme numerabile di simboli di funzione o di ope- 
razione; 

f) simboli di punteggiatura; 

£) connettivi proposizionali A, V, —, >, ®; 

kh) quantificatori I, V. 


Tra tutte le catene di simboli di L, ci si restringe alle espressioni ben for- 
mate, cioè tipograficamente corrette e che non introducono confusione di varia- 
bili nella quantificazione. Vengono chiamate formule (ben formate) di L. So- 
no definite ricorsivamente a partire dalle formule elementari di base — dette 
formule atomiche — del tipo x=y, P(x1, ...,.%), f(%1, ...,%,)=2 (ove P è una 
relazione n-aria, f una funzione di x variabili, x, y, 2, %1; «.., %, delle variabili o 
delle costanti) mediante la regola che segue: 


REGOLA. Se g e sono delle formule e x una variabile, allora v@, pAù, 
@Vy, Ax sono delle formule (a condizione che per Hxg, 4 non contenga 
già una quantificazione su x). 


Come è noto, si può definire V in termini di » e di UH e i connettivi > 
e è in termini di — e A, o di “ e V. 

Si dicono enunciati le formule senza variabili libere cioè le formule in cui 
tutte le variabili sono quantificate. Soltanto gli enunciati possono avere un va- 
lore di verità una volta interpretati semanticamente. 

Per trasformare in calcolo il linguaggio dei predicati occorre disporre da una 
parte di un insieme di assiomi logici e dall’altra di un insieme di regole di de- 
duzione. 

L’insieme degli assiomi comprende 1) gli assiomi del calcolo proposizionale; 
2) gli assiomi dell’uguaglianza: l'uguaglianza è una relazione di equivalenza che 
soddisfa lo schema di assioma di sostituzione 


(1) VaVy (a=y > (9>9')), 


dove © è una formula e @' si ottiene a partire da @ sostituendovi con y un nume- 
ro arbitrario di occorrenze di x; 3) gli assiomi di particolarizzazione del quanti- 
ficatore universale e d’introduzione del quantificatore esistenziale: 


(2) Vap(x)=> (a) 
(3) P(a)>Hxp(2). 


Quanto all’insieme delle regole di deduzione, esso comprende, fra le altre, 
le seguenti: 


REGOLA DEL « MODUS PONENS). Se @ e pepe sono dei teoremi, allora Y è 
un teorema. 

REGOLA. Se p><(a) è un teorema e se @ non contiene la costante a, allora 
VxW(x) è un teorema. 

REGOLA. Se ©(a)>ù è un teorema e se Ù non contiene la costante a, allora 
Hxp(x)>Y è un teorema. 
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Prendendo gli assiomi come teoremi di base si costruisce dunque ricorsiva- 
mente, per applicazione ripetuta di queste regole, un insieme di formule di L 
dette teoremi del calcolo CP dei predicati, o dette ancora formule derivabili, 
dimostrabili o deducibili, indicate di norma con |- g. A questi teoremi pura- 
mente logici (indipendenti da ogni semantica) si può ricorrere costantemente. 

Più in generale sia ® un insieme di formule di CP. Si dice che la formula 
è derivabile da X e si indica con X}- , se 4 può essere ottenuta da una catena 
deduttiva che fa intervenire come teoremi di base non soltanto gli assiomi di 
CP ma anche le formule di X (o ipotesi). Nella pratica più che dimostrare 
Z+-g si vorrebbe dimostrare -X=%. Che queste due proprietà siano equiva- 
lenti nel caso degli enunciati è contenuto nel teorema seguente: 


TEOREMA DI DEDUZIONE (Herbrand, 1928). .Se 2 è un insieme finito di enun- 
ciati e se © è un enunciato, XY p implica -Z=>oq. 


Osservazione: - X=> implica 2+ q è la regola del modus ponens enunciata 
sopra. 
Osservazione: Il teorema di deduzione è falso per le formule in generale. 


Si ritorni ora alla semantica. Sia 4= <A, R,, ..., R,) una struttura defini- 
ta su un insieme di base A dalle relazioni R}, ..., R, (o dalle funzioni e dalle 
operazioni: com'è noto, se f : A"+A è una operazione F(2%3, ..,%)=2, le si 
associa la relazione R; definita da (x1, ..., x, %,41)€ R; se e solo se f(x, seg Ep) 
=%Xny41). Per « parlare » di A si utilizza il calcolo dei predicati. In L viene sele- 
zionato un insieme Ri, ..., R} di simboli di relazione con la stessa arietà rispetti- 
vamente di R,, ..., R,. La corrispondenza biunivoca Ri +R; viene detta una in- 
terpretazione di L in A, o anche una semantica. 

Ma per poter interpretare gli enunciati di L in A, occorre ancora dare.re- 
gole per l’interpretazione delle variabili e delle costanti. 

Per quanto riguarda le variabili, si introduce la seguente idea fondamentale. 

Anche se al livello della loro costruzione dal punto di vista insiemistico gli 
elementi di A non sono degli elementi semplici ma a loro volta degli insiemi 
(come per esempio nel caso dei numeri reali nella costruzione di Dedekind o 
delle funzioni di uno spazio funzionale) li si considera come elementi semplici 
(Urelemente o atomi). Nell’universo della teoria degli insiemi che governa l’a- 
spetto semantico, si tronca la gerarchia associata alla relazione di appartenenza 
al livello degli elementi della struttura presa in considerazione e si pone che le 
variabili di L sono riferite a questi Urelemente. 

Si restringe allora la quantificazione agli elementi delle strutture (per esem- 
pio viene vietata la quantificazione sui sottoinsiemi di A). Questa restrizione de- 
finisce cioè la cosiddetta logica dei predicati del primo ordine. I teoremi fon- 
damentali della teoria dei modelli dipendono in modo essenziale da tale restri- 
zione. 

Parlare di una struttura al primo ordine vuol dire dunque considerare di 
essa soltanto le proprietà formulabili in un linguaggio dalle risorse ben limitate. 
In rapporto al calcolo dei predicati adattato alla teoria generale degli insiemi 
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(teoria dei tipi alla Russell), questo fatto introduce una rottura. Ma proprio 
tale rottura offre strumenti per l'indagine del rapporto tra sintassi e semantica. 

Per le costanti si adotta la seguente strategia. I simboli di costanti di L 
sono riferiti a elementi strutturalmente distinti. Per parlare per esempio di R 
occorre disporre di simboli che denotino o e 1. A seconda della scelta degli 
elementi distinti, si ottengono teorie non equivalenti. Per esempio la teoria di 
R in cui è disponibile, oltre a o e 1, anche il simbolo di costante x, è più ricca 
della teoria in cui sono disponibili soltanto o e 1. 

È però una pratica abituale quella d’introdurre un simbolo nuovo ogni vol- 
ta che viene definito un nuovo elemento. Affinché questa procedura sia sem- 
pre lecita, talvolta si conviene di prendere come linguaggio di base relativo a 
una struttura 4 il linguaggio L, (0 L 4) ottenuto aggiungendo a L dei «nomi» 
per tutti gli elementi dell'insieme A base di A. L'insieme delle costanti di L4 
in generale non è numerabile. 

Se si dispone di una interpretazione di L in # ogni enunciato del primo or- 
dine relativo ad A è traducibile in un enunciato formale di L e reciprocamente 
ogni enunciato di L è interpretabile come enunciato del primo ordine relativo 


ad f. 


Dopo avere interpretato L in A, vi si interpreti il calcolo dei predicati. La 
nozione di base è quella (semantica) di validità di un enunciato. 


DEFINIZIONE. . Un enunciato © di Lx è valido in A se è vero una volta inter- 
pretato. 

DEFINIZIONE. Se @ è valido in A (e si indica con &t- 9) si i dice che A è un 
modello di q. 


Pit generalmente se 2 è un insieme di enunciati e se AF @ per ogni enun- 
ciato © di X, si dice che A è un modello di X. La validità si definisce ricor- 
sivamente in modo evidente. 

Si definirà ora la nozione di teoria nel suo doppio aspetto sintattico e se- 
mantico. 

Lato sintattico: sia 2 un insieme consistente di enunciati, cioè un insieme 
di enunciati da cui non è possibile derivare una contraddizione; X è detta allora 
una teoria. 


DEFINIZIONE. Si chiama poi teoria di X, e si indica con Th(X), l'insieme 
degli enunciati derivabili da X (cioè la chiusura deduttiva di X). 


Verrà indicata con M(X) la classe dei modelli di X, cioè la classe delle strutture 
per cui esiste un’interpretazione di L che rende validi gli enunciati di X. 
Lato semantico: sia data una struttura $: 


DEFINIZIONE. Si chiama teoria di A, e si indica con Th(A), l'insieme degli 


enunciati validi in A. Per definizione 4 è un modello di Th(A). 


Pit in generale: sia K una classe di strutture dello stesso tipo (cioè definite 
dagli stessi simboli di costante e dagli stessi simboli di relazione). 


& 
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DEFINIZIONE. Si chiama teoria di K e si indica con Th(K) l’insieme degli 
enunciati validi in ogni struttura 4 di K. 


L’analisi del rapporto fra sintassi e semantica consiste per prima cosa nel 
domandarsi: 1) Dato un insieme di enunciati X, che rapporto c'è fra Th(Z) 
e Th(M(X)), cioè tra l'insieme degli enunciati derivabili da X e l’insieme 
degli enunciati validi in ogni modello di 2? 2) Data una struttura A, esiste 
un insieme finito di enunciati X tale che Th(4)=Th(X) cioè tale che ogni 
enunciato valido in A sia derivabile da X? Si dice in questo caso che A e la 
sua teoria sono finitamente assiomatizzabili. 3) Siano 4= <A, R;), B= B, S) 
due strutture dello stesso tipo. Si supponga Th(A)=Th(9). Ciò vuol dire allo- 
ra che 4 e $ sono isomorfe? Non necessariamente. Nel caso in cui questo si 
verifica si dice che la teoria di A è categorica. 

L’idea ingenua che ci si forma del rapporto di adeguazione tra sintassi 
e semantica indurrebbe a ritenere che, data una struttura concreta A, la sua 
teoria dovesse essere al tempo stesso categorica e finitamente assiomatizzabile, 
ovvero che esiste un numero finito di proprietà caratteristiche di A tali che 
1) ogni proprietà di 4 è derivabile da queste; 2) ogni struttura che possiede 
queste proprietà è isomorfa a A. 

Nel seguito si vedrà come questa idea sia definitivamente falsa al primo or- 
dine e come esista uno scarto fra sintassi e semantica che può essere analizzato 
in quanto tale. 


Prima di affrontare i teoremi di base che consentono una tale analisi, ecco 
una prima forma dell’adeguazione fra sintassi e semantica. 

Gli enunciati di una teoria Th(A) si suddividono in due classi: da una parte 
gli enunciati che dipendono dalla struttura particolare di 4 e dall’altra quelli che 
ne sono indipendenti. In relazione a questi ultimi, si ha innanzitutto la defi- 
nizione. seguente: 


DEFINIZIONE. Un enunciato è detto universalmente valido se è valido in ogni 
interpretazione. 


Per rispondere alla domanda 1), occorre, prima di analizzare particolari in- 
siemi di enunciati, prendere in considerazione il caso X= QI. Th(X) si riduce 
allora all'insieme dei teoremi di CP e Th(M(X)) all'insieme degli enunciati 
universalmente validi (poiché ogni struttura è modello dell’insieme vuoto di 
enunciati). 

Domanda: Quale rapporto c'è fra i teoremi di CP e gli enunciati universal- 
mente validi? 

Siccome è banale verificare che gli assiomi di CP sono universalmente validi 
e che le regole di deduzione conservano la validità universale, si può mo- 
strare facilmente un primo risultato: 


x 


TEOREMA. Ogni enunciato che è un teorema di CP è universalmente valido: 
se + g, allora AE per ogni struttura A.. 
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Questo teorema ha per corollario il seguente risultato di base: 


‘TEOREMA DI CONSISTENZA DEL CALCOLO DEI PREDICATI. CP è consistente cioè 
= @ è un insieme consistente di enunciati. 


2.2. I teoremi di base della teoria dei modelli. 


I teoremi di base della teoria dei modelli si dividono in due gruppi. Da una 
parte quelli che dimostrano risultati positivi di compatibilità fra sintassi e se- 
mantica e dall'altra quelli che dimostrano risultati negativi di limitazione in- 
terna. In generale la restrizione al primo ordine è essenziale. 


Teoremi positivi. Il teorema di completezza di Gòdel [1930] è il reciproco 
del teorema di p. 471: 

TEOREMA (Gédel, 1930). Ogni enunciato universalmente valido è un teorema 
di CP: se At @ per ogni interpretazione di ©, allora | q. 


A questo teorema, come è noto, può essere data una forma più forte: 


TEOREMA. Un insieme di enunciati è consistente se e solo se ammette un modello. 


La dimostrazione classica del teorema di completezza è troppo tecnica per 
essere anche soltanto abbozzata in questa sede [il lettore è rimandato, per esem- 
pio, a Bell e Slomson 1969 e Robinson 1963]. Più oltre se ne darà una versione 


diversa. | 
Eccone comunque alcune conseguenze fondamentali: si può già dare rispo- 


sta a domande come la 1) di p. 471. 


PROPOSIZIONE. Sia X un insieme consistente di enunciati e sia XK una classe 
di strutture dello stesso tipo. Si ha: 

1) Th(M(X))= Th(X) 

2) M(Th(M(Z))) = MX) 

3) Th(M(Th(K)))= Th(K). 

Un'altra conseguenza del teorema di completezza è il teorema fondamentale 
di esistenza dei modelli: 


TEOREMA DI COMPATTEZZA. Sia 2 un insieme di enunciati. Se ogni sottoin- 
sieme finito X, di © ammette un modello, allora © ammette un modello. 


Dimostrazione: Se X non ammettesse un modello, sarebbe inconsistente 
per il teorema presentato sopra. Un X, sarebbe allora inconsistente e perciò 


senza modello. Contraddizione. . l 
Osservazione: Si vedrà nel seguito come rendere costruttiva questa dimo- 


strazione astratta. 
coRoLLARIO. Sia X una teoria. Una struttura # può essere immersa in un 
modello di X se e solo se ogni sottostruttura finita di 4 può essere immersa in 


un modello di X. i 
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Un'altra conseguenza del teorema di completezza ha una maggiore rilc- 
vanza epistemologica. Come osservano Bell e Slomson [1969, pp. 65-66], do- 
po Kreisel [1967, p. 153], la funzione essenziale del calcolo dei predicati è di 
provare a «catturare» sintatticamente non tanto la nozione di enunciato uni- 
versalmente valido, quanto quella di enunciato logicamente valido, cioè valido 
in ogni interpretazione, incluse le interpretazioni in ogni universo della teoria 
degli insiemi (universi che ron sono insiemi). Va sottolineato come a priori 
l'insieme degli enunciati logicamente validi contenga quello degli enunciati 
che sono teoremi del calcolo CP dei predicati e sia contenuto in quello degli 
enunciati universalmente validi. Il teorema di completezza di Gédel afferma 
proprio che questi tre insiemi sono identici. 


Teoremi di limitazione. Il più noto è certamente il teorema di incomple- 
tezza [Gòdel 1931], che si richiama qui nelle linee essenziali. Anzitutto: un 
linguaggio L (non necessariamente del primo ordine), in cui si esprime l’iden- 
tità, viene usualmente detto sufficientemente potente se è in grado di espri- 
mere l’aritmetica elementare. Il risultato gédeliano si può allora esprimere cost: 
1) se si richiede che l'insieme degli assiomi specifici di un sistema formale sia 
decidibile (ossia che sia sempre possibile decidere in modo effettivo - cioè con 
mezzi puramente costruttivi — per ogni formula (ben formata) del linguaggio in 
questione se si tratta o meno di un assioma), allora non può esistere un sistema 
formale del primo ordine (e neanche di ordine superiore) consistente e suffi- 
cientemente potente nel quale tutti gli enunciati veri della matematica, espri- 
mibili nel sistema, siano teoremi; 2) la consistenza (o non-contraddittorietà) 
di un sistema del primo ordine (e neanche di ordine superiore) consistente e 
sufficientemente potente non può venir dimostrata entro il sistema stesso. Da 
questa stessa formulazione segue immediatamente che, per sistemi di ordine su- 
periore al primo, viene meno quella forma di adeguazione della sintassi alla se- 
mantica di cui si è parlato sopra. 

Ma pure al primo ordine sussiste uno scarto tra sintassi e semantica che 
concerne la questione della categoricità. Sussiste infatti, per teorie al primo 
ordine, il seguente teorema: 


TEOREMA (Lòwenheim-Skolem, prima versione [cfr. Lòwenheim 1915; Sko- 
lem 1920]). Sia X una teoria che possiede un modello infinito. Se X. è finito, X 
ha un modello per ogni cardinale infinito. Se X è infinito di cardinale x, X ha 
un modello per ogni cardinale > a. 


Questo teorema è qui decisivo: è infatti il teorema generale di esistenza dei 
modelli non standard: esistono modelli della teoria (al primo ordine) di R per 
ogni cardinale superiore alla potenza del continuo. 

Sotto il profilo generale il teorema di Léwenheim-Skolem mostra che teo- 
rie che ammettono modelli infiniti (cioè la maggior parte delle teorie interes- 
santi) sono non categoriche in quanto due strutture con cardinali differenti non 
sono isomorfe: la risposta alla domanda 3) di p. 471 è in generale negativa. 
Occorre di conseguenza relativizzare la nozione di categoricità. 


+ 
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DEFINIZIONE. Sia a un cardinale. Una teoria X è detta x-categorica se tutti 
i modelli di 2 di cardinale a sono isomorfi. 


Alcuni teoremi classici sono teoremi di «-categoricità. 

Si consideri per esempio la teoria Xp degli insiemi densamente ordinati 
senza primo ed ultimo elemento. Se A=<A,<) è un insieme totalmente 
ordinato, la proprietà di densità esprime che per ogni coppia (x, y) di ele- 
menti di 4 tale che x<y, esiste un elemento intermedio x<3<y. 

TEOREMA (Cantor, 1895). Xp è N -categorica (ove &, è la potenza del nu- 
merabile). 


coroLLario. Tutti gli insiemi numerabili 4= <A, <) densamente ordi- 
nati senza primo ed ultimo elemento sono isomorfi a <Q, <>. 


Osservazione: È possibile dimostrare che Xp non è a-categorica per a>No 


Si consideri ora la teoria Zog dei corpi commutativi algebricamente chiusi, I 
modelli di Zog soddisfano un numero infinito di assiomi: quelli finiti dei corpi 
commutativi e, per ogni neN, l’assioma 7, che esprime che ogni polinomio di 
grado n possiede una radice. 

Osservazione: È possibile mostrare che non si può ricondurre l'insieme in- 
finito dei 1, a un insieme finito. La proprietà di essere algebricamente chiuso 
non è, per un corpo, una proprietà del primo ordine, o aricora, la teoria Zcc 
non è finitamente assiomatizzabile (cfr. sopra, p. 471). 

Dato un corpo commutativo K si può mostrare 0 che per ogni xe K, x30 
si ha nx0 per ogni intero neN: si dice allora che K è di caratteristica 0; 
o che esiste un più piccolo numero primo » tale che pw=o0 per ogni xe K:: 
si dice allora che K è di caratteristica p. Ogni corpo di caratteristica o (come 
Q, Ro C) è una estensione di Q e ogni corpo di caratteristica ) è un’estensione 
del corpo finito F,= Z/p Z degli interi modulo p. Q e F,, sono detti corpi primi 
(cfr. l’articolo « Divisibilità» in questa stessa Enciclopedia). 

Osservazione: La proprietà 0, di essere di caratteristica f è, per un corpo, 
una proprietà del primo ordine. Al contrario la proprietà o, di essere di carat- 


teristica o, che risulta la congiunzione infinita A(-—0p), non è del primo or- 


dine. 
. Sia allora Zocy (rispettivamente Zco,) la teoria dei corpi algebricamente 
chiusi di caratteristica ) (rispettivamente di caratteristica 0). 


TEOREMA (Steinitz, 1910). Le teorie Zoo, e Zoo, SONO a-categoriche per ogni 
cardinale x>&. 

COROLLARIO (caratterizzazione di C). Ogni corpo algebricamente chiuso di 
caratteristica zero avendo la potenza del continuo è isomorfo al corpo C dei 
numeri complessi. 


Osservazione: È possibile mostrare che Zcc, non è &-categorica. 
Il concetto di x-categoricità si è rivelato abbastanza potente per consentire 
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una classificazione delle teorie. Infatti si ha il profondo risultato dovuto a Mor- 
ley che risolve una congettura di Log: : 


TEOREMA (Morley, 1964). Se una teoria è w-categorica per un cardinale 
a>&, essa è B-categorica per ogni cardinale B>&,. 

COROLLARIO. Esistono soltanto tre possibilità per una teoria che ammette 
modelli infiniti: a) è x-categorica per ogni cardinale « infinito; 5) è a-categorica 
solo per a=&; c) è «-categorica per ogni «>, senza esserlo per S,. 


2.3. «Indiscernibilità» dei modelli e completezza. 


In un certo qual senso le proprietà del primo ordine sono elementari. Il te- 
ma di questo approccio all’analisi non standard è quello: 1) del rapporto che 
esiste tra una struttura concreta e la sua teoria al primo ordine; 2) dell’analisi 
delle estensioni *R di R che ne sono «indiscernibili ». Tali estensioni esistono 
soltanto se Th(R) non caratterizza R. E questo già è noto proprio per il teore- 
ma di Léwenheim-Skolem (cfr. sopra, p. 473). 

i È dunque naturale interrogarsi sulla relazione di equivalenza che ricopre 
l’«indiscernibilità» di due strutture. Si tratta della cosiddetta equivalenza ele- 
mentare, Intuitivamente due strutture # e ® dello stesso tipo sono elementar- 
mente equivalenti se hanno la stessa teoria al primo ordine: Th(A)=Th(9). 


Ma occorrono alcune precauzioni per il fatto che A e B non hanno necessaria- 
mente le stesse costanti. 


. DEFINIZIONE I. Siano A e D due strutture dello stesso tipo con insiemi di base 
rispettivamente A e B. Sta N un sottoinsieme di ANB. A e D sono dette elemen- 
tarmente equivalenti relativamente a N se 4 e D hanno la stessa teoria relativa- 


mente a Ly, cioè se soddisfano gli stessi enunciati purché questi abbiano le loro 
costanti in N. 


Questa definizione si divide in due sottodefinizioni (2 e 3). 


DEFINIZIONE 2. A e D sono dette elementarmente equivalenti (si scrive f=® ) 
se sono elementarmente equivalenti relativamente all'insieme delle loro costanti 
strutturali (per esempio o e 1 per ogni corpo). 


hi chiaro che la relazione di equivalenza elementare è una relazione di equi- 
valenza. 


PROPOSIZIONE (banale). Se 4 $, allora #=9 (& indica l’isomorfismo). 


Osservazione: Se reciprocamente 4= 9 implica A= 9, ciò significa che la 
teoria di 4 è categorica (cfr. sopra, p. 471). 


DEFINIZIONE 3. Siano 4 e B due strutture dello stesso tipo tali che A sia una 
sottostruttura di B (ATB). (Si può, al solito, supporre più generalmente che 
di sia immersa in 9 mediante un'iniezione j : > che conserva le strutture 
e identifica A e j(A)). Si dice che B è una estensione elementare di A — e si scrive: 
A<B - se A e B sono elementarmente equivalenti relativamente ad A. 


È 
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Questa nozione cruciale è stata introdotta da Tarski e Vaught. 


PROPOSIZIONE (banale). Se #<9, allora A= B. 
PROPOSIZIONE. Se A è una struttura finita, tutte le sue estensioni elemen- 
tari sono banali (cioè isomorfe a A). 


Le nozioni di equivalenza elementare e di estensione elementare sono no- 
zioni semantiche di origine sintattica. Sono legate in modo essenziale al lin- 
guaggio di base; inoltre sono molto meno fini della relazione di isomorfismo, 
puramente semantica. Ma proprio per questo permettono una prima classifi- 
cazione delle strutture e delle loro teorie. i 

La nozione chiave per la teoria dei modelli non standard è, infine, quella di 
estensione elementare. Tale nozione è più forte di quella di equivalenza ele- 
mentare. Dire infatti A< non significa semplicemente 4C 8 e A= B. Vuol 
dire invece che le proprietà strutturali di tutti gli elementi di # sono conser- 
vate per estensione a È, o ancora che nell’estensione a ® nessun nuovo elemen- 
to viene a sostituirsi a un elemento di 4 facendolo «scadere» da una proprietà 
del primo ordine. 

Si considerino per esempio le. strutture d'ordine A= NNX(0), <) € 
B= N, <) ACB e AB. Se AnD, allora A= 8 (cfr. p. 475). Ma 8 non è 
una estensione elementare di A. Infatti, quando si passa da 4 a 9, l'elemento 
1, che è il primo elemento di # (proprietà del primo ordine) si trova « soppian- 
tato» dall’elemento o di B. L'enunciato Va (x=>1) che è un enunciato di Ly 
non vale più in 8. Il che non impedisce che A e 9 siano isomorfi. Ciò signi- 
fica semplicemente che l’isomorfismo cost definito è incompatibile coll’immer- 
sione AC B. 

Il fatto che nessun elemento di A debba trovarsi «scaduto» da una delle 
sue proprietà fornisce un criterio per le estensioni elementari, che permette 
di restringersi a una sottoclasse di enunciati. 

Applicando proprio tale criterio si può dimostrare il seguente risultato assai 
significativo: 


TEOREMA. <Q, <>) <R, <>. 


Era già noto (teorema di Cantor: cfr. sopra, p. 474) che la teoria Xp degli 
insiemi densamente ordinati senza primo e ultimo elemento è N -categorica e 
che dunque ogni modello numerabile di Xp è isomorfo a <Q, <). Si vede ora 
che <R, <) - che non può essere isomorfo a (Q, <) poiché non numerabile — 
è un'estensione elementare di <Q, <). Ciò mostra in particolare che la proprietà 
fenomenologica primaria di R, quella di essere un continuo, non è una pro- 
prietà del primo ordine (cioè elementare) della sua struttura d’ordine. (Si veda 
anche, a questo proposito, l'articolo «Continuo/discreto » in questa stessa En- 
ciclopedia). 


Il concetto di estensione elementare precisa lo scarto sintassi/semantica 
enunciato dal teorema di Léwenheim-Skolem. La precedente formulazione del 
teorema può venir scomposta nei due emunciati seguenti: 
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 TeoREMA (Léwenheim-Skolem, downward). Sia ® un insieme di enunciati 
di L di cardinale a che ammette un modello infinito di cardinale > a; se a è infi- 
nito, © ha un modello di cardinale a, altrimenti © ha un modello di cardinale &,. 


Osservazione: Come corollario, sl ottiene immediatamente che esistono 
modelli numerabili della teoria al primo ordine dei numeri reali. Quando com- 
parve sulla scena matematica, questo straordinario risultato è stato classificato 
come un paradosso. In realtà, mostra semplicemente la forza della restrizione 
al primo ordine. 

i Rilevante all'esistenza dei modelli utilizzati dall'analisi non standard è poi, 
direttamente, il secondo enunciato: 


TEOREMA (Léwenheim-Skolem, upward). Sia X una teoria di cardinale «. 
Se X ha un modello infinito, ha un modello per ogni cardinale infinito B=«. 


Dimostrazione, nelle linee essenziali [per i dettagli si veda ad esempio 
Bell e Slomson 1969, pp. 81-82]: si utilizzerà in modo specifico la nozione di 
estensione elementare: sarà sufficiente mostrare che se A è una struttura infinita 
di cardinale « — in cui il linguaggio L è interpretato — A possiede estensioni ele- 
mentari per ogni cardinale f>a,p, ove p è il cardinale del linguaggio L, cioè il 
cardinale dell'insieme dei simboli di L. 

. A questo scopo, sia X=Th(4) relativamente a Lj e B=a,p. Sia B un 
insieme di cardinale f. Si formino poi gli insiemi di enunciati K,={a34b} 
per ac 4, beB, i quali esprimono che A, base di #, e B sono disgiunti; e 
Kg={bx7#bs} per b,,b,e B con b, bo, i quali esprimono che elementi di B di- 
stinti sono distinti. Sia X' = YU KU XK. 2’ è di cardinale f} ed è consistente. Se 
non lo fosse, esisterebbe un insieme finito 2;=Z;UK,; UK; da cui si deriva 
una contraddizione. K,;UK,; non può essere vuoto in quanto X, ammette un 


modello f e pertanto è consistente. Siano 41, ..., @,, di, ..., by le costanti di 
Kay Kay. Poiché A è infinita, si può riferire b,, ..., d,, a m elementi distinti 
di A e distinti da 47, ..., a,. 2} è dunque consistente in quanto ammette A co- 


me modello. Contraddizione. Dunque Z' è consistente. Per il teorema di com- 
pletezza (cfr. sopra, p. 472), ammette un modello BR. B è di cardinalità B, 
AB e poiché B è un modello di X, teoria di A relativamente a L,, A<8B. 


COROLLARIO. Esistono modelli non standard di R. 


Le nozioni di equivalenza elementare e di estensione elementare consen- 
tono anche di definire certe proprietà strutturali delle teorie che generalizzano 
quelle di categoricità. È naturale, infatti, chiedersi quali teorie posseggano la 
proprietà per cui tutti i loro modelli sono «indiscernibili». A seconda che si 
scelga l'equivalenza elementare o l'estensione elementare, si ottengono due 
ilistinte nozioni di «completezza» di una teoria. 


DEFINIZIONE. Una teoria X è deita completa se tutti î suoî modelli sono ele- 
mentarmente equivalenti. 


PROPOSIZIONE. Sia 4 una struttura: 2=Th(A) è completa. 
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coroLLarIo (Lindenbaum). Ogni teoria ammette una estensione completa. 


La proprietà di completezza, apparentemente semantica, è equivalente in 
realtà, per il teorema di completezza, a una proprietà sintattica. Si ha infatti 
il seguente teorema: 


reoreMa. Una teoria X è completa se e solo se, per ogni enunciato @, è sia 
Zb9, sia Zog. 


Dire che una teoria X è completa significa dunque affermare che la sua 
chiusura deduttiva X* è completa nel senso di massimale: non è possibile 
aggiungerle alcun enunciato senza abolirne la consistenza. Il teorema appena 
enunciato fornisce un utile strumento per mostrare che certe teorie ron sono 


complete. 


Esempio. 

La teoria dei corpi commutativi (anche algebricamente chiusi) non è com- 
pleta. Infatti la caratteristica di un corpo (che è una proprietà del primo ordine 
se essa è diversa da zero: si veda l’osservazione a p. 474) non è derivabile dagli 
assiomi dei corpi. te 

È dunque opportuno disporre di un criterio efficace che assicuri che una teo- 
ria è completa. 


TEOREMA (Eos-Vaught, 1954). Se X è una teoria senza modelli finiti e a- 
categorica per un cardinale a infinito, X è allora completa. 


Osservazione: Questo risultato mostra proprio che la nozione di comple- 
tezza è un indebolimento di quella di categoricità. 


coroLLARIO. La teoria Xp degli insiemi con ordine denso senza primo e 
ultimo elemento è completa. 


Dimostrazione: Teorema di Cantor (cfr. sopra, p. 474). 


COROLLARIO. <Q, <>)=<R, <). I . ; da 
coroLLarIo. Le teorie Zog, € Zoc, dei corpi algebricamente chiusi di ca- 
ratteristica o e p sono complete. 


Dimostrazione: Teorema di Steinitz (cfr. sopra, p. 474). 

Osservazione: Già si è visto che ogni corpo algebricamente chiuso di carat- 
teristica o avente la potenza del continuo è isomorfo a Cc. e 

Si constata ora che ogni corpo X algebricamente chiuso di caratteristica to) 
è elementarmente equivalente a C. Se dunque si dimostra una proprietà del 
primo ordine per C, automaticamente essa è dimostrata per K, per esempio 
per le chiusure algebriche dei corpi di funzioni razionali. Si tratta di un caso 
particolare (principio di Lefschetz) di un principio generale di gigi 
la cui importanza epistemologica è stata sottolineata da Robinson: ‘ L'uso di 
linguaggi formali ci permette di studiare simultaneamente intere classi di teore- 
mi laddove la pratica matematica ordingria si deve limitare ai singoli teoremi 
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considerati uno per uno. In particolare, in alcuni casi, diventa possibile dimo- 
strare che se un teorema di una data classe è vero per una struttura di un certo 
tipo è vero anche per una struttura di tipo diverso ad essa collegata. Chiamere- 
mo principi di trasferimento risultati del genere. Anzi, il classico principio di 
dualità della geometria proiettiva può essere considerato come un teorema 
metamatematico di questo tipo. Il carattere logico di questo principio, però, è 
cosf immediato che la sua scoperta non ha reso necessaria formalizzazione al- 
cuna» [1963, trad. it. p. 52]. 


La nozione di completezza che si deve a Robinson e che viene associata 
non più all’equivalenza elementare ma alla estensione elementare è più sottile 
in quanto quest’ultima non è una relazione di equivalenza. 


DEFINIZIONE. Una teoria © è detta W-completa (completa rispetto ai modelli) 
se per ogni inclusione ACD di modelli di XL, A<G. 


La M-completezza può essere ricondotta alla completezza se si prendono 
in considerazione i linguaggi Ly. 


DEFINIZIONE. Sia A una struttura di base A. Si chiama diagramma di A 


(e si scrive D(A)) l'insieme degli enunciati atomici e delle negazioni di enunciati 
atomici di L, che sono validi in A. 


Una struttura ® è un modello di D(A) se e solo se contiene una sovrastrut- 
tura isomorfa ad A. 


TEOREMA (definizione sintattica della M-completezza). Una teoria X è M- 


completa se e solo se per ogni modello 4 di X la teoria ZUD(A) è una teoria com- 
pleta di L,. 


Osservazione: Benché fortemente correlate, le nozioni di completezza e di 
M-completezza hanno ciascuna il loro specifico interesse. Si consideri per esem- 
pio la teoria 2£= Th(M) in cui M= <N, <> (teoria degli insiemi numerabi- 
li con ordine discreto e con primo elemento). Essendo la teoria di una strut- 
tura, essa è completa. Ciò nonostante l’esempio dell’estensione non elementare 
NX(0), <>) CN, <> mostra che essa non è M-completa. 

Dualmente, si vedrà tra breve che la teoria dei corpi algebricamente chiusi 
è M-completa. Ora (si veda l'esempio a p. 478) essa non è completa. 

L’accoppiamento dei teoremi sulla definizione sintattica della M-comple- 
tezza (cfr. sopra) e sulle condizioni di completezza di una teoria (p. 478) for- 
nisce un criterio per mostrare che una teoria non è M-completa. Ma è oppor- 
tuno disporre anche di un criterio che permetta di mostrare che una teoria è 
M-completa. Tale criterio è stato introdotto da Robinson. Esso si basa sull’i- 
dea che per sapere se una teoria è completa, basta verificarlo per una classe 
abbastanza ristretta di enunciati [cfr. ibid., p. 117]. È in questo modo che si 
è potuto dimostrare il seguente teorema: 


TEOREMA. La teoria Xcc dei corpi algebricamente chiusi è M-completa. 
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Che la teoria dei corpi algebricamente chiusi sia M-completa è dato qui co- 
me un risultato. Sotto il profilo storico si tratta però dell’origine concettuale 
della nozione di M-completezza. Introducendo quest’ultima, Robinson si era 
proposto infatti di tradurre nei termini puramente metamatematici della iosa; 
dei modelli la proprietà di chiusura algebrica dei corpi e di farne un paradigma 
per le teorie algebriche in generale. o, i È 

D'altronde il teorema or ora enunciato non è altro che una riformulazione 
metamatematica di una delle chiavi di volta della geometria algebrica, cioè il 
Nullstellensatz di Hilbert (cfr. gli articoli « Geometria e topologia » e « Invariante » 
in questa stessa Enciclopedia). Ora, la definizione di base della geometria algebri- 
ca è quella di varietà algebrica. Sia K un corpo. Le varietà algebriche su K sono 
i sottoinsiemi di K® definiti dall’annullarsi di sistemi di polinomi fi o In 
eK[x,, ..., %pj- Se V è una varietà di K” definita dai polinomi fo eofo è chia- 
ro che ogni polinomio f appartenente all’ideale è = (f1 Sp) di K Den al 
generato da fi, ..., f, è identicamente nullo su V. V è dunque definita dall’i & e 
3. Se J= K[x,, ..., x] è l'ideale improprio di K[xy sg Cn V È vuota poiché 
1eS e 1 non si annulla mai. Il problema è allora di sapere se ogni ideale pro- 
prio definisce una varietà non vuota. 

TEOREMA (NulIstellensatz). Se K è algebricamente chiuso ogni ideale proprio 3 
di K[x,,..., xp] ammette uno zero. 


Dimostrazione (nelle linee generali): Occorre mostrare che se Fe DI (do- 
ve V è la varietà definita dall’annullamento di 3) allora esistono dei polinomi 
81 gpeK[2), ». xp] tali che 


gifi=1 


Il 
A 


ta enerano 3. . 
de ci aa allora Vx'= 2 per ogni estensione K' di K ove Vg' è la va- 
rietà di K'” definita dagli stessi polinomi di V (estensione del corpo degli sca- 
lari). È possibile supporre K' algebricamente chiuso. Siccome V= @ è una 
proprietà del primo ordine, 1) è una conseguenza diretta della M-completezza 


di Koc- pa n 
2) Se Vy'= 2 per ogni estensione K' di K, $ è improprio: 1€ ù o ancora 
esistono g1, ..., ge K[x,, ..., xp] tali che 


P 
Y gifi=1. 
Fi 


Se 3 fosse proprio, 3 sarebbe contenuto in un ideale massimale M di 
K[x,, ..., xp]. Ora, il quoziente K'= K{[x, 2-3 %n]/M è un'estensione di K. Sia 
a; î=1,..., n, l’immagine in K' del polinomio x;. Siccome f;eM, (= 1, o di 
il punto (4, ..., ay) di K'* è un punto di Vy/. Dunque V'# 2. Contraddi- 
zione. Ì . A ” 

Si vede che l'essenziale della dimostrazione è proprio la M-completezza 
Zoe 


Cosi la teoria dei corpi algebricamenta chiusi è M-completa, cioè completa 
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per l’estensione elementare, anche se non è completa, cioè non è completa per 
l'equivalenza elementare. A prima vista può sembrare paradossale. In realtà 
non si deve dimenticare che se l'estensione elementare è una relazione essenzial- 
mente più forte di quella di equivalenza elementare nella misura in cui è rela- 
tiva ai linguaggi ZL, e non al linguaggio L, è nello stesso tempo pit debole nella 
misura in cui considera solo coppie di modelli di cui l’uno è l'estensione del- 
l’altro. Ora, ogni corpo è una estensione di un corpo primo, Q per la caratteri- 
stica o e F,=Z/pZ per le caratteristiche finite p. Due corpi di cui l’uno è l’e- 
stensione dell’altro hanno dunque necessariamente la stessa caratteristica. Si 
è visto sopra (p. 478) che l’indeterminazione della caratteristica è proprio il 
solo ostacolo alla completezza di Zio. 

Il rapporto fra quanto si è dimostrato a p. 478 circa la teoria dei corpi com- 
mutativi, e circa i corpi algebricamente chiusi di caratteristica o oppure p, 
e infine a p. 479 circa la M-completezza dei corpi algebricamente chiusi, si 


basa dunque sull’esistenza dei corpi primi. Tutto ciò è immediatamente gene- 
ralizzabile. 


DEFINIZIONE. Sia X una teoria. Un modello % di X è detto primo se ogni mo- 
dello di possiede una sottostruttura isomorfa a A. 


TEOREMA (criterio del modello primo). Se X è una teoria M-completa che 
possiede un modello primo, è allora completa. 


Dimostrazione: Sia A, il modello primo di 2 e A,, #3 due modelli. Esi- 
stono un 4, , CA, e un Agg CE Ap tali che AlgnAp=A,p. Siccome X è M- 
completa, A,yn<A, e Aspg<A,. Dunque A,p=A, e Ayg=A,. E siccome 
fiptApzhon An3Ahg 


COROLLARIO. Le teorie Zoc, € Zco, sono complete. 


Dimostrazione: Zog, € Zco, sono M-complete poiché Zoc è M-comple- 
to. Zoc, ammette per modello primo la chiusura algebrica Q del corpo pri- 
mo Q e Z00, ammette per modello primo la chiusura algebrica F, del corpo 
F,=Z/pZ. 

Analogamente si può mostrare: 


TEOREMA. La teoria Xp degli insiemi con ordine denso senza primo ed ul- 
timo elemento è M-completa. 


COROLLARIO. <Q, <><<R, <). 
COROLLARIO. Xp è completa. 


Dimostrazione: Z,, ammette <Q, <) per modello primo. 


Si vede cosi prendere forma una teoria coerente delle teorie stesse, al- 
meno delle teorie algebriche. Dopo i primi lavori pionieristici, quest’analisi 
del rapporto sintassi/semantica si è arricchita in modo considerevole e ha 
portato a profondi risultati. Per esempio è degno di nota, fra i tanti, il se- 
guente: 
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TEOREMA. Sia X una specificazione della teoria dei corpi che sia completa 
e & -categorica, allora X 0 è la teoria Zoc,; 0 è la teoria Zog, 0 è la teoria di 
un corpo particolare. 


Una delle conseguenze pit fruttuose della problematica della comple- 
tezza è stata lo sviluppo di una metamatematica dell’algebra. Passando dal- 
l’algebra alla logica si è mostrato che certe nozioni algebriche erano gene- 
ralizzabili in nozioni puramente logiche; passando dalla logica all’algebra si 
è mostrato che certi teoremi classici erano essenzialmente più di natura lo- 
gica che algebrica. Questo era, ad esempio, il caso dell’interpretazione dei 
teoremi di Steinitz e di Cantor in termini di completezza, del principio di 
Lefschetz in termini di principio di trasferimento e del NulIstellensatz in ter- 
mini di M-completezza. : 

Come ha osservato Robinson: «Spesso in algebra ci si imbatte in concetti 
alla cui base stanno idee fondamentali che, anche se vaghe, sembrano avere 
un raggio di applicazione più generale di quanto appaia dalle definizioni con- 
crete... Capita spesso inoltre che in un solo concetto si trovino riunite più 
idee fondamentali. Concetti del genere, una volta che ci si muova in contesti 
più generali, possono cosi spezzarsi in più nozioni come anche in ambiti di- 
versi essere passibili di interpretazioni diverse» [1963, trad. it. p. 168]. 

Il carattere metamatematico di questo approccio è evidente in quanto fa 
uso esplicito della nozione di deducibilità, malgrado che questa si possa ri- 
definire in termini di teoria dei modelli [cfr. ibid., p. 169]. Va osservato che 
una delle traduzioni più importanti di nozioni algebriche in un quadro me- 
tamatematico è quella di «chiusura algebrica » in termini di M-completamento 
(0 «completamento rispetto ai modelli»). Definire quest’ultima nozione è pres- 
soché immediato. Si dimostra infatti [ibid., pp. 136-37] che per ogni insieme 
di enunciati K (non vuoto e non contraddittorio) non può esistere a meno di 
equivalenze più di una estensione K' di K che sia al contempo M-comple- 
ta e M-consistente relativamente a K (K' si dice M-consistente se ogni mo- 
dello M’ di K' è modello del diagramma D di un modello M di K): que- 
sto insieme K', se esiste, è detto appunto M-completamento di K [ibid., p. 
157]. In modo «naturale» ci si interroga allora circa l’esistenza di M-comple- 
tamenti per teorie in generale: si cerca cioè un correlato della nozione di « chiu- 
sura algebrica» per strutture per le quali una nozione di chiusura non è 
emersa in modo naturale. Uno dei più importanti successi di questa strate- 
gia è stato il chiarimento concettuale della risoluzione (da parte di Artin e 
Schreier, 1927) del diciassettesimo problema di Hilbert (dimostrare la con- 
gettura: una funzione razionale definita positiva è sempre una somma di qua- 
drati di funzioni razionali) nei termini di M-completamenti [in particolare, 
ibid., pp. 254-66]. Infine: una strategia del genere non risulta più applicabile 
nel caso di teorie algebriche sempre più fondamentali e meno semplici (la 
più fondamentale e meno semplice è forse la teoria dei gruppi): ciò conduce 


allora a indebolire dapprima la nozione di M-completezza e quindi quella ‘ 


stessa di validità (teoria del forcing sviluppata, tra gli altri, dallo stesso Ro- 
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binson). Queste più recenti ricerche non possono venir affrontate qui: si 
termina quindi il riepilogo di alcuni risultati di completezza associati alla 
«indiscernibilità » e si passa a delineare un metodo esplicito di costruzione di 
estensioni elementari, cioè di modelli non standard. 


2.4. Metodo degli ultraprodotti. 


Finora si dispone solo di un teorema di esistenza (Lòéwenheim-Skolem) 
dei modelli non standard: ma per lavorare entro tali modelli occorre anche 
un metodo uniforme di costruzione. Si è rivelata particolarmente efficace la 
cosiddetta tecnica degli ultraprodotti. Se ne daranno i lineamenti essenziali, ri- 
mandando a testi specifici [per esempio Bell e Slomson 1969] per i dettagli. 


Il metodo degli ultraprodotti è un metodo semantico di costruzione di mo- 
delli a partire da modelli già disponibili. Com'è noto, il modo più semplice 
di costruire strutture è quello che consiste nel considerare prodotti diretti. 
Perché non percorrere anche qui questa via? La difficoltà sta nel fatto che la 
classe M(2) dei modelli di 2 non ha nessuna ragione a priori di essere chiusa 
rispetto all’operazione di prodotto diretto (per esempio il prodotto diretto di due 
corpi non è mai un corpo). È dunque necessario «raffinare» la nozione di pro- 
dotto diretto. L’idea fondamentale - dovuta a Los — consiste nel lavorare nel 


prodotto 
Ar=|]A 
I RI i 
indebolendovi la nozione di validità in una nozione di validità «quasi-ovunque» 
(q.0.), cioè relativizzando tale nozione assoluta a un «opportuno» insieme D 
di parti dell’insieme / degli indici. Il problema diventa allora quello di sapere 
. 3 condizioni su D il «prodotto» degli A; relativi a D è ancora un modello 
il. 
IR Sia dunque D un insieme di parti di I. Si indebolisce la nozione di iden- 
tità su 
Ar=]]A 
ie 
ponendo che gli elementi a= (4;);:r © b= (b;);[ di 4y sono equivalenti (ab) 
se il sottoinsieme UCI degli i tali che a;=d; appartiene a D. Si vuole che 
la relazione » sia una relazione di equivalenza: 1) — deve essere riflessiva: 
aa per ogni ae /y. Ciò esige che Je D; 2) — deve essere simmetrica: sea nb, 
allora ba. Ciò è vero qualunque sia D; 3) — deve essere transitiva: se ab 
e be, allora ave. Siano U=fieI|a;=b;}, V=f{ieI|b,=c}e W=fieI|a;= 
=c;}. Per ipotesi U,VeD: è banale verificare UNV CW. Si vuole che 
U,Ve D implichi sempre We D. Ciò esige: 1) se U, Ve D, allora UNVe D: 
D è chiuso per le intersezioni finite; 2) se ZeD e Z2W, allora We D: Dè 
chiuso per estensione. 
i D'altra parte la relazione — non deve essere una equivalenza banale su 47 
(cioè si deve evitare che tutti gli elementi risultino equivalenti). Ciò esige 


DED. 
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DEFINIZIONE. Sia I un insieme. Un filtro su I è un insieme non vuoto D di 
parti di I tale che: 

a) DED, 

b) se U,VeD, allora UNV e D, 

c) se USV e se Ue D, allora VeD. 


Dunque si è mostrato: 

PrOPOSIZIONE. Se D è un filtro su Z, — è una relazione di equivalenza. 

Sia dunque D un filtro: si denoti con Ap = 4,/D il quoziente di A, per la 
relazione di equivalenza », cioè l'insieme delle classi di equivalenza à, di ele- 
menti ac 4y. 


Sia Ry una relazione n-aria di 4,. Le viene allora associata la relazione «re- 
lativizzata» Rp,, che È soddisfatta solo se Ry è soddisfatta «quasi-ovunque». 


., An )e Re D. 
3 An)€ Dq.o. 


DEFINIZIONE. (a, ui an) Rpg see solose U=fieI|(a,,;, 
PROPOSIZIONE. Fao. è compatibile con la relazione =: se ue. 
e se a vby per &R=1,..., 7, allora (bi, ..., b)ERpio- 


Dimostrazione: Sia Ux={iel|a,,j=bx,;} e sia V={ieI|(b,j 
Si vuol mostrare Ve D. Ma UNU,N...NÙ,CV e U, Un... 
Per la definizione di filtro, Ve D. 

La relazione Rp,,, Passa dunque al quoziente e definisce una relazione Rp 
su Ap. 


bn.) € Ri}. 
, Une D per ipotesi. 


coroLLarIo. Se {A;};cr è una e di strutture di un certo tipo e se 
D è un filtro su /, la struttura Ap=A,/D è una struttura dello stesso tipo. 


Resta da analizzare a quali ulteriori condizioni su D, fp sarà un modello 
di 2 se le A; sono modelli di X. Si deve ora «relativizzare » la nozione di va- 
lidità. 


DEFINIZIONE. Sia @ un enunciato del linguaggio L associato al tipo di strut- 
tura considerato. Si dice che © è quasi ovunque valido in Ar e si scrive: A de ? se 
fiel| A, g}eD. 


Il problema è ora di sapere a quali condizioni su D la validità quasi ovunque 
su 4; si identifica con la validità su fp: 


(1) Art 9 se e solo se ApE 9. 
q.0, 


Il ragionamento è per induzione sulla complessità degli enunciati. 

a) Sia a=b un enunciato atomico di L interpretato come a;=b; inf 
a=bin A;ceà=binAp Apha=bseesoloseà= =b se e solo se ab se e 
solo se {ie/|a;=b;}e D se e solo se Arha=b. 


q.0. 
b) Sia R(a,, ..., an) un enunciato atomico di L interpretato come (4,,;) +» 
a, QeRin Ai (a, .. a)eRrin Are (à,,.... a )eRp in Ap: Ape R(4, 
a,) se e solo se (à,, 


..., An) Rp se e solo se (ay ... An) ERp,o Se € solo se 
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fiel|(a,,;,..., 0, )eRi} e D se e solo se {{eI|%;t R(a;, ..., a,)} € D se e solo 
se Ar= R(4,, ..., n). 
q.o. 
c) Sia p=dAy una congiunzione di enunciati. Siano U= Sh EY}, 


V={ieI|A;y} e W={ieI| A YAy}. Apt @ se e solo se Apeye ApEyY 
se e solo se (per ipotesi di induzione) fiE Ù e fre se e solo se U, VeD. 


D'altra parte fre pueé solo se We D. Ma Ww= UA VA Ora, essendo D un fil- 


tro, U,VeD se n ‘solo se UNVeD. 

d) Sia p=Ax J(x) un enunciato esistenziale. Si supponga Apt g. Ciò si- 
gnifica che esiste un ac A, tale che ApEU(Aa). Sia a=(4;);cr l'elemento di 
A, corrispondente al simbolo di costante che denota à. Per ipotesi di induzione 


ApEY(a) se e solo se fi Y(a) se e solo se U=fieI|A;Ey(a;)}} e D. 
D'altra parte Arp se € sale: se V=fiel|A;= g} e D. Ma USV. Siccome D 


è un filtro, VeD e dunque 4rE @ 


q.0. 


Reciprocamente si supponga fl 9. Ciò significa V={ieI|A,t- @}e D. Sia 


te V. Esiste un elemento «; di A; tale che A;= U(a;). Sia a un elemento di A; 
tale che aj= 4, Se A; 9 e tale che a; sia qualunque se non 4;E g. L'esistenza 
di un tale a è garantita dall’assioma della scelta. Siccome VCW={ieI|4;5 


= y(4;)} per costruzione, Ve D implica We D cioè A 1 V(a). Ma per ipotesi 
di ricorrenza fiE da) se e solo se ApEy(d ). Dunque Apto. 


e) Sia infine sl = << un enunciato negativo. Apt @ se e solo se non ApE y 
se e solo se (per ipotesi di ricorrenza) non frE 9 se e solo se U={ie/|k;F 
=4}€D. Reciprocamente fr se e solo se V={fieI|k -W}eD. Ma 


siccome sia A;=y, sia A; SÙ U=IXV. (U e V sono complementari). 
Per soddisfare la (1) occorre dunque che D goda della proprietà supplemen- 
tare: 


(2) Per ogni UCI, UeD see solo se I-UeD. 


DEFINIZIONE. .S? chiama ultrafiltro su I un filtro che possiede la proprietà (2). 


Si è dunque dimostrato il risultato fondamentale: 
TEOREMA [Los 1955]. Se D è un ultrafiltro su I, per ogni enunciato p: 


(3) ApF 9 se e solo se Art v. 
0, 


DEFINIZIONE. Se D è un ultrafiltro su I, Ap si chiama l’ultraprodotto degli 
A. Se Ah,=A per ogni iel, Ap si chiama una ultrapotenza di A. [Cfr. Keisler 
1965 per un riassunto del metodo degli ultraprodotti]. 

i assi Se Ap è un ultraprodotto di modelli di X, fp è un model- 
o di X.. 
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Dimostrazione: Sia @ un enunciato di X. Esso è valido in tutti gli 4,. Dun- 
que fiel|A;=@}=I. Siccome D è un filtro Ie D e dunque diro. Per il 
teorema di Lo$, fpk 9. 


Si consideri il caso di un’ultrapotenza Ap di A. Un elemento ae A, può 
essere considerato come quell’applicazione a :/> A che è definita da îHa,. 
Per tale ragione si utilizzerà talvolta una notazione funzionale f : > A e s’in- 
dicheranno con f, g, ecc. gli elementi di A, o di Ap. Sia ac A e f,:I>A 
la funzione costante f,(î)=a. L'applicazione a-+f, è una immersione di A 
in Ap. Se infatti f,=f, in Ap, favf in Are U=fieI|f()=f(i)}eD. Se 
axb, U= 4. Ora, Z&D poiché D è un filtro e dunque f,#f, in Ap. In breve, 
Ap è una estensione di A. 


coroLLARIO. Se Ap è un’ultrapotenza di A, T'estensione A°> Ap è elemen- 
tare: AxAp. 


Dimostrazione: Sia (4, «+ A) un enunciato di L, ove le costanti a, 
sono ir come fa, in Ap e faz(i) in A;=A. Per il teorema di Los, 
ApE (4, ..., 4,) se e solo se A,E 9(4,, ... 4,) se e solo se U={ieI|A;k 

q0. 


E P(fali) Wai Ma Ul faar g(4,,..., an)} e dunque U=S 
o I. Siccome ZED, Ue D se e solo se U#@ se e solo se AE (4, ..., dn). 

Per il teorema di Lo$, si ha dunque a disposizione un metodo uniforme di 
costruzione di estensioni elementari. A priori questo metodo è molto potente 
poiché si possono scegliere arbitrariamente sia l’insieme di indici / sia l’ultra- 
filtro D. Resta però il problema di sapere se si possono ottenere in questo mo- 
do estensioni elementari in senso proprio: nulla assicura ancora che l’ultrapo- 
tenza Ap non sia isomorfa ad 4. 


Siccome esiste un rapporto tra un ultrafiltro D e l’ultraprodotto o l’ultrapo- 
tenza fp, la struttura delle estensioni elementari cosi ottenute dipende da quel- 
la di D. Si analizza allora la struttura degli ultrafiltri. Ne esistono due tipi fon- 
damentali. È chiaro, anzitutto, che se UC/, U# @ l'insieme Fy={VCI|USV} 
delle estensioni di U è è un filtro su I. 


DEFINIZIONE. Un filtro D è detto principale se D è di tipo Fy per USI. 


PROPOSIZIONE. Un ultrafiltro D su I è principale se e solo se D=F} per 
xel. 


Gli ultrafiltri principali sono senza interesse, in quanto conducono a esten- 
sioni elementari banali: 


TEOREMA. Sia {A;},-1 una famiglia di strutture dello stesso tipo e D un ul- 
trafiltro principale su I. Allora l’ultraprodotto Ap è isomorfo a una delle 4;. In 
particolare se A;=A per ogni i, l’ultrapotenza Ap è isomorfa a A. 


Affinché il metodo sia fecondo, si debbono dunque considerare ultrafiltri 
non principali. 
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DEFINIZIONE. Un ultrafiltro non principale è detto libero. 


Si tratta di sapere a quale condizione su / esistono degli ultrafiltri liberi. 


PROPOSIZIONE. Se / è un insieme finito, tutti i suoi ultrafiltri sono prin- 
cipali. 


Si dovrà quindi prendere / infinito. 

Notazione: Se / è un insieme infinito si indichi con F., l’insieme delle parti 
U di I complementari di parti finite. Essendo / infinito, tutti gli elementi U 
di F., sono infiniti. È banale verificare che F, è un filtro (filtro di Fréchet di I ) 


PROPOSIZIONE. Se / è un insieme infinito esistono su / degli ultrafiltri liberi. 
Questi ultimi sono i raffinamenti massimali del filtro F.. 


Osservazione: Non solo esistono ultrafiltri liberi su / se / è infinito, ma 
ne esistono anche «tanti». Se I è di cardinale x>S, P(1) è di cardinale 2% 
e l’insieme degli insiemi di parti di / è di cardinale 2°°, Ci sono dunque al 
massimo 2?° filtri su /, a fortiori al massimo 22° ultrafiltri, a fortiori al massimo 
22° ultrafiltri liberi. Ora, 


TEOREMA (T'arski). Se I è di cardinale a>X,, esistono 22° ultrafiltri liberi su I. 


Affinché il metodo degli ultraprodotti possa fornire delle estensioni elemen- 
tari in senso proprio occorre che / sia infinito e che l’ultrafiltro D sia libero. 
Ma occorre anche, per ciò che riguarda #, che # sia una struttura infinita, 
Si ha infatti la seguente proposizione: 


PROPOSIZIONE. Se D è un ultrafiltro (libero o principale) e se 4 è una strut- 
tura finita, Anfp. 


Questo risultato non si estende agli ultraprodotti. Dunque, al fine di otte- 
nere estensioni elementari in senso proprio col metodo degli ultraprodotti, è 
necessario considerare strutture infinite e ultrafiltri liberi. Ma ciò non è anco- 
ra sufficiente. Da qui si aprono due strategie. La prima consiste nell’esibire, nel 
caso particolare preso in considerazione, un elemento ae Ap tale che A&A. 


Esempio. 


Sia N l'insieme N degli interi dotato della sua struttura naturale. Siano 
I=N e DIF. un ultrafiltro libero su /. Si consideri l’ultrapotenza *NX=MNp= 
=QN/D. Un elemento di *M è semplicemente una classe di equivalenza di 
applicazioni f : N-N, gli elementi di Ml corrispondendo alle applicazioni co- 
stanti. Sia ae *M l'elemento rappresentato dalla funzione f(2)=n. Sia peN un 
intero qualunque. V,={neN|f(n)>p}= {neN I n>p} ha complemento finito: 
V,€FCD, cioè V,, veD. Dunque per ogni peN, a>p è valido in *M: a è un 
elemento di *M che non appartiene a M. L'estensione elementare N< *M è 
non-banale: *M è un modello non standard dell’aritmetica. 


Tale esempio ‘è qui di importanza capitale per il fatto che, essendo à un 
intero «infinito», il suo inverso, nell’ultrapotenza Rp, sarà infinitesimale. 
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La strategia di cui si è appena visto un esempio è « viziata» però dal fatto di 
non essere generalizzabile. Se si vuole disporre di teoremi generali ” istoni 
di ultrapotenze che siano estensioni elementari in senso proprio, è asi ne 
cessario raffinare l’analisi della «dialettica» fra h e D. Questa strategia oa 
nativa che in particolare consente di ottenere risultati sulla cardinalità . - 
ultrapotenze è troppo tecnica per essere qui abbozzata [cfr. per esempio Be 


e Slomson 19609]. 


Oltre a consentire la costruzione esplicita delle estensioni elementari, il 
metodo degli ultraprodotti fornisce anche una tecnica molto potente di dimo- 
strazione nella teoria dei modelli. Permette per esempio: 1) di ri-dimostrare 
in modo semantico certi teoremi di base; 2) di dimostrare facilmente che - 
proprietà non sono del primo ordine; 3) di disporre di nuovi criteri di comple- 
Fallo al punto 1), si dimostrano i due teoremi fondamentali di comple- 
tezza e di compattezza già presentati sopra (p. 472). 


TEOREMA DI COMPATTEZZA (Tarski-Scott-Morel). Un insieme di enunciati 
V ammette un modello se e solo se ogni sottoinsieme finito A di © ammette un mo- 


dello. 


imostrazione: Sia /=F(2) l'insieme delle parti finite A di X. Per ogni 
ut per ipotesi un am, fa di A. Sia Ael e *= {A'e/| ASCA}. 
L’insieme F delle A* è un insieme di sottoinsiemi non vuoti di I che pos- 
siede la proprietà che l’intersezione di un numero finito di suoi o È 
sempre non vuoto. Se infatti Af,... AZ eF, ROIO Par * 
implica che F è estendibile a un filtro e dunque a un ultrafiltro D. Sia £p l'u 


traprodotto (II Aa\/D. 
« \AeK 4 
Sia ora @ un enunciato di X. {pg} =A,€I e Ant. Dunque Ant se 


ASA. Siccome Af={AcI| ASA} C {AeI|kak 9} e AfeD, {Ael|Aat 
- p}e D. Si ha dunque Apt 0. Ap è un modello di ogni enunciato di X cioè 
un modello di X. 


coroLLARIO (teorema di completezza). Un insteme di enunciati X è const- 
stente se e solo se ammette un modello. 


Dimostrazione: Se X è consistente, ogni sottoinsieme finito di x è a 
stente e ammette dunque un modello. Per il teorema di Tarski-Scott-More 


Z ammette un modello. 


Quanto al punto 2) si dimostra che le proprietà di un corpo di essere di 
caratteristica o oppure di essere algebricamente chiuso, non sono delle proprietà 


del primo ordine. 
PROPOSIZIONE. La teoria dei corpi di caratteristica 0 non è finitamente as- 
siomatizzabile. 
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Dimostrazione: Si supponga che il fatto di essere di caratteristica o sia un 
enunciato cy (al primo ordine) della teoria dei corpi. Per ogni numero primo P 
sia K, un corpo di caratteristica p. Sia D un ultrafiltro libero sull’insieme (in- 
finito) dei numeri primi P e sia K l’ultraprodotto K = ][K,/D. Per il teorema 

P 


. , x 4 . A . . pe . . 
di Los K è un corpo. K non può essere di caratteristica pe P. Infatti la proprie- 
tà 0, d’esser di caratteristica f essendo del primo ordine, U,={gqeP|K,k0,}= 
={p}€D poiché D è libero. Dunque K è di caratteristica o. Si ha allora KE (er 


e, per il teorema di Los, [| K,=0,. Contraddizione: 0, non è del primo ordine. 
peP q.0. 
Nello stesso spirito si può dimostrare la proposizione seguente: 


PROPOSIZIONE. La teoria dei corpi algebricamente chiusi (di caratteristica 
o oppure p) non è finitamente assiomatizzabile. 


Riguardo al punto 3), si indicherà soltanto come si possano caratterizzare 
col metodo degli ultraprodotti sia l'equivalenza elementare sia l’estensione ele- 
mentare e dedurne nuovi criteri. Per esempio: 


TEOREMA [Keisler 1962]. Due strutture dello stesso tipo sono elementarmente 
equivalenti se e solo se hanno ultrapotenze isomorfe. 


Osservazione: La dimostrazione di Keisler fa intervenire l’ipotesi genera- 
lizzata del continuo. Kochen ha mostrato come farne a meno utilizzando il 
metodo detto degli ultralimiti (catene infinite di estensioni elementari ottenute 
da ultrapotenze). 


2.5. Strutture di ordine superiore e metodo degli allargamenti di Robinson. 


Il metodo degli ultraprodotti (si veda l'esempio di p. 487) permette di ot- 
tenere esplicitamente delle estensioni elementari in senso proprio *R di R che 
1) contengono degli infinitesimi; 2) sono al primo ordine «indiscernibili» da R. 

Ciò «risolve» a livello aritmetico-algebrico il paradosso dell’infinitesimale 
leibniziano. Ma non è ancora sufficiente a fondarne una «dottrina », che meriti 
il nome di analisi non standard. 

Infatti nell’estensione *R di R si è tenuto conto solo dell’universo degli 
Urelemente. Se f:R+R è per esempio una funzione, nulla assicura a priori che 
sia prolungabile in una funzione *f: *R+*R che svolga in rapporto a *R il 
ruolo che svolge f in rapporto a R. Ma l’analisi si basa proprio sullo studio 
di entità come le funzioni e degli «spazi» che esse costituiscono. Per parlare di 
analisi non standard occorre dunque disporre di modelli non standard di R 
n cui tutte le entità dell’analisi siano automaticamente estendibili con un metodo 
uniforme. Ciò impone di arricchire considerevolmente il dominio degli Ure- 
lemente e di prendere in considerazione — senza pertanto «uscire» dal primo 
ordine — quelle che si chiamano strutture di ordine superiore. 

Si parte dall’insieme U,=R che verrà detto la base della struttura di ordine 
superiore e si costruisce progressivamente un insieme U che svolge il ruolo di 
universo del discorso per R, cioè per l’analisi (reale). Sia P(R) l'insieme delle 
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parti di R e sia U,=RU?P(R)=UU9(Uo). Si definisce in modo analogo U, 
con U,=U,U9(U;), ecc. Si pone: UU: 


Tutte le entità dell’analisi sono elementi di U. Una relazione n-aria su R 
è un sottoinsieme di R” ed è un elemento di U; una funzione f : R?+R si può 
identificare, al solito, con una relazione (n-+1)-aria; una funzione f : R*+R? 
è un insieme di f relazioni (n+1)-arie, ecc. U contiene tutte le relazioni definite 
su R, tutte le funzioni, tutte le relazioni di relazioni, tutte le famiglie di funzioni 
indicizzate da un insieme di U, ecc. In breve, U è proprio un duniverso del di- 
scorso » per l’analisi (reale). a 

Sia £= La, il linguaggio ottenuto a partire dal linguaggio L dei predicati 
del primo ordine per aggiunta dei simboli della teoria degli insiemi e di 
simboli di costanti per tutti gli elementi di UL. Si è cosf introdotta una diffe- 
renza importante: non si utilizza più L per parlare di un insieme omogeneo 4 
di Urelemente ma per parlare dell'insieme eterogeneo di Urelemente U che co- 
stituiscono l’«universo » delle costruzioni insiemiste basate su A. In particolare, 
è ora consentito quantificare sui sottoinsiemi di A, sui sottoinsiemi dell’insieme 
dei sottoinsiemi di A (per esempio filtri), sulle applicazioni, sulle ‘funzioni, ecc. 

Benché ciò faccia uscire dal primo ordine relativamente ad A, si resta nel 
primo ordine relativamente a U. Il prezzo che si deve pagare per tale esten- 
sione è doppio. — se n 

Le quantificazioni diventano, come si dice usualmente, limitate, cioè re- 
lative a un dominio specificato. Si consideri per esempio l’enunciato che espri- 
me che R è archimedeo. Non è possibile formalizzarlo Vx(x30 > VyHn(|nx|> 
>|y{)) poiché cosi facendo si quantificherebbe su tutti gli elementi di ÙU e non 
su R e su N. Al contrario, è possibile formalizzarlo con 


Vx(xeRAxz0o > Vy(yeR > Hn(neN > [nx]>]p]))) 


ossia, abbreviando, con 


VxeR(x#0 > YyeR IneN(|rx|>]y])) 


dove tutte le quantificazioni sono limitate. un 

Ma si deve tenere conto anche della eterogeneità di U. Poiché i simboli di 
variabile di £ si riferiscono a tutti gli elementi di U, se non si prendessero 
delle precauzioni si otterrebbero enunciati che « mescolano » le entità (per esem- 
pio «La funzione seno è un numero primo» o «Tutti i filtri dividono vV2 ») 
e per ciò stesso non interpretabili. Per evitare tali confusioni, è ormai abituale 
stabilire una gerarchia dei tipi di entità e stratificare gli enunciati relativamente 
a questa gerarchia. Si porrà che gli elementi dell'insieme A base di U sono di 
tipo o, che una relazione binaria i cui argomenti sono di tipo o è di tipo (0, 0), 
ecc. (definizione ricorsiva), e si autorizzeranno soltanto le formule «stratificate » 
per le quali ci sia coerenza dei tipi. > 

Una volta prese queste precauzioni sintattiche si può mostrare che tutt? 2 
risultati della teoria del primo ordine restano validi per U. . 

È quindi lecito applicarli. Sia 2 ="ThU l'insieme degli enunciati di L 
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validi in U. U è un modello di X che viene detto modello o universo standard, 
si dice modello non standard ogni estensione elementare e in senso proprio 
*U di U. 

Per maggiore comodità si continuerà ad indicare con *R un universo non 
standard dell’analisi. 

Ma ciò che è essenziale è il fatto che, ormai, ogni entità 9 costruita a par- 
tire da R ammette per costruzione (automaticamente e in modo uniforme) una 
estensione non standard *8 dello stesso tipo, costruita a partire da *R e che 
possiede le stesse proprietà del primo ordine di 3. Per esempio *R è archimedeo 
relativamente a #N poiché l’enunciato 


VxeR(x30 > VyeR UneN(|nx|>]y])) 
essendo valido in R è valido automaticamente in *R: 


Vxe*R(x#0 > Vye*R Une *N(|nx|>{y])). 


Ma la manipolazione degli «universi» non standard esige ancora una precau- 
zione essenziale. Infatti l’insieme U è gerarchizzato dalla relazione insiemista 
di appartenenza e. La stessa cosa avviene per *MU. Ma in #9U esiste anche la 
relazione *e che è l'estensione della relazione ristretta a U. Ora, le relazioni 
*e e e di *U non sono identiche. U è, per costruzione, «completo » relativamen- 
te a e. Ma *9U non è «completo» relativamente a *e. Si preciserà ora questa 
difficoltà che per molto tempo ha costituito un ostacolo a una dottrina coerente 
degli «universi» non standard. 

Sia U l'universo di base A e U<*9U una estensione elementare (in senso 
proprio). Gli elementi di *U si dividono in due classi. Da una parte quelli di 
8. (considerato come immerso in *U), detti entità standard. Dall’altra quelli 
di *U-U, detti entità non standard. Se YeU è una entità standard di *%U, si 
continuerà spesso con l’indicarla con ® (invece che con *9). 

Sia $ un elemento di U. Essendo U una gerarchia insiemista, 3 è in generale 
un insieme (eccetto quando 9 è un Urelement della base A). Ora, come entità 
standard di *%, 9 è anche un insieme. Ma ciò non implica che 9 sia un in- 
sieme standard (cioè che & sia composto solo da elementi standard). Si suppon- 
ga per esempio che A=R, e che 8 sia un intervallo [a, 3]. L’entità standard 
9 di *U che possiede la stessa denotazione [a, d] è composta non soltanto dai 
numeri reali standard xe [a, b], ma anche dai numeri reali non standard x +€ 
ove xe]a, b[ e € è infinitesimale. Più in generale: se gli elementi di 9.eU sono 
definiti in U dalla formula ae$, questa formula, interpretata in *U, definisce 
gli elementi standard a*e9 di 9.e *U. Ma gli elementi di *9.e *U sono definiti 
in #9 dalla formula ae *8. Ora, quest’ultima ron è identica alla formula a *e9. 
Sussiste il seguente risultato banale: 


PROPOSIZIONE. Se 9 è finita, allora *9=9 (come insieme). 


Osservazione: Per non fare un uso continuo degli aggettivi standard e non 
standard, si adotterà la regola seguente: le entità e le proprietà standard saran- 
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no citate senza tale qualificativo. Le entità e le proprietà non standard corri- 
spondenti saranno precedute da un #. Un insieme »-finito di *9U sarà per 
esempio un insieme di cardinale ae *N, ecc. 


Il problema è dunque che se U è «l’universo di discorso» di base A, *U 
non è in generale l'universo del discorso di base *A: relativamente a e, *9U è 
«incompleto », esso non contiene tutti i sottoinsiemi degli insiemi che lo co- 
stituiscono. Si dice che *U è un modello non regolare nel senso di Henkin 
[1949; 1950]. 

Si consideri per esempio una estensione elementare stretta R<*R. Come 
sottoinsieme (nell’«universo» globale della teoria degli insiemi preso in consi- 
derazione) di *R, R è perfettamente definito. Come entità standard di *U, R, 
denotato dallo stesso simbolo della base R di U, è l'insieme dei numeri x+É 
ove xeR (standard) e È è o nullo o infinitesimale. È possibile perciò dire che 
R (relativamente a *U) è l'insieme dei numeri reali finiti. Ma questo insieme 
non ha nessun equivalente nella base R di U. Se infatti ne avesse uno, poiché 
l'inclusione stretta RC*R in #U «ridiscende» in U, si otterrebbe una inclu- 
sione stretta FCR, ove F sarebbe l'insieme dei numeri «finiti» di R (stan- 
dard): è chiaro che una tale espressione è senza significato. Ciò conduce alla 
seguente definizione fondamentale: sia X un *-insieme (cioè un elemento di 
*1), Si indichi con X l’insieme dei suoi x-elementi. X={x*eX}. Tra i sot- 
toinsiemi di È ci sono i suoi #-sottoinsiemi, cioè gli Y per Y*CX con Ye *U. 
Ma in generale ce ne sono anche degli altri. 


DEFINIZIONE. Sia Xe *U un »-insieme e X l'insieme dei suoi «-elementi. Un 
sottoinsieme di X è detto interno se è della forma Y per un *-sottoinsieme Y di X; 
altrimenti è detto esterno. Poiché tutte le entità sono assimilabili a sottoinsiemi, 
si parlerà dunque di entità interne e esterne di *%. 


L'opposizione interno/esterno è decisiva nella misura in cui assicura la 
consistenza del metodo dei modelli non standard di ordine superiore attraverso 
la regola di quantificazione seguente: 


PRINCIPIO DI QUANTIFICAZIONE NEGLI UNIVERSI NON STANDARD. Gli enun- 
ciati della teoria 2 diU sono validi, una volta trasferiti a *9U, soltanto se la quan- 
tificazione vi è ristretta alle entità interne. 


Osservazione: Tale principio non è, per essere precisi, un «principio ) poi- 
ché, per costruzione, esso è sempre assicurato. È piuttosto una regola euristica 
concettualmente necessaria per evitare paradossi. Infatti permettersi di quanti- 
ficare non solo sugli Urelemente della base ma anche su una gerarchia di insiemi 
e di sottoinsiemi fa correre il rischio di confondere in *9U le relazioni xe X e 
x*e X cosi come anche XCY e X*CY. 


Esempio. 


Sia *N un modello non standard di N. Sia 9 l’enunciato del primo ordine 
di L che esprime che ogni sottoinsieme di N ha un primo elemento. Questo 
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x 


enunciato è valido in *N. Ora, sia *N\N l’insieme degli interi «infiniti». È 
chiaro che esso non potrebbe comportare primi elementi poiché se a è «infi- 
nito», x—I è ancora «infinito». Apparentemente, una contraddizione. Ma essa 
si trasforma in teorema se si fa uso della regola euristica su accennata. 


TEOREMA. // sottoinsieme *N\N di *N è un sottoinsieme esterno. 


Si dànno alcuni criteri per riconoscere entità interne: 


a) Se X è standard, allora X è interno. 
b) Se X è un insieme standard di cui tutti gli x-elementi sono standard 


(in particolare se X è finito, per la proposizione di p. 491), tutti i suoi 
*-sottoinsiemi sono interni. 


ni Ma il criterio più efficace afferma che se X è già interno tutti i suoi sotto- 
insiemi definibili in £ sono interni. Più specificatamente: 


c) TEOREMA (criterio di internalità). Sia X un »-insieme di *U e YCX. 
Y è interno se e solo se esistono una formula @(4, ...:9%) di £ e degli 
d,;...,0n€ *U tali che Y={xeX|q(a,, ..., 4, x)}. 


n Infine, per concludere questa esposizione della teoria elementare dei modelli, 
si indica un tipo particolare di modelli non standard (individuati da Robinson) 
di cui si farà uso nel seguito. 

: Si consideri su R la relazione binaria R(x, y)=x<y. R possiede la proprie- 
tà seguente: se essa ammette una «soluzione» per un numero finito di ele- 
menti del suo dominio, essa ammette una «soluzione comune», cioè: se His 
meR, esiste un yeR tale che x,<y, ...; x <y. Affermare che esistono in una 
estensione *R di R numeri «infiniti» significa proprio dire che esiste una 
«soluzione» di R «comune» a tutti gli elementi del suo dominio standard. 

Onde la generalizzazione: 


. DEFINIZIONE. Sia R una relazione binaria di U di dominio Dp. Si dice che R 
è concorrente se Vxy,..., Vane Da4y(R(x,,9) A... AR(%n,9)) è sempre valido in 
U (qualunque sia n). 

DEFINIZIONE. Un modello non standard *U di U è un allargamento se per ogni 
relazione concorrente R di U, l’enunciato Ty *e DagVae Dr(R(x,9)) è valido 


în #UL. 


TEOREMA. Ogni universo ammette degli allargamenti. (È possibile mostra- 

re che si possono ottenere degli allargamenti *A come ultrapotenze di U im- 
ponendo delle ulteriori condizioni sull’ultrafiltro D). 
. Dimostrazione (Robinson): Si introduce per ogni relazione concorrente R 
di U un nuovo simbolo «x (destinato a denotare la «soluzione» comune di 
VaeDrR(x,y)). Sia An l'insieme di enunciati {R(a, &r)}aepg € SIA Zo= 


ZULA r (ove C è l’insieme delle relazioni concorrenti di Ù e X la teoria 
E 
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di UL relativamente a £). Un allargamento di U è per definizione un modello di 
Zo. Per i teoremi di completezza e di compattezza, è sufficiente mostrare che 
ogni sottoinsieme di X, della forma X;= ZU Az (dove /\, è un sottoinsieme 
finito di_J A x) ammette un modello. Si consideri un tale A ;. È un insieme finito 
i ae iz R; rrente ed 
di enunciati R;(4,, «;) (dove a;= x,). Ma per ogni 7, essendo R; conco! 
essendo gli a; in numero finito, a, è riferibile a un elemento di U. U è dunque 
un modello X;: Zo ammette un modello. 

Gli allargamenti sono dei modelli non standard «abbastanza grossi» da far 
si che l'opposizione interno/esterno sia nello stesso tempo operatoria e uni- 
forme. Esistono in particolare «abbastanza » entità non standard come è mostra- 
to dai due risultati seguenti: 


PROPOSIZIONE. Sia *SU un allargamento di U e XeU un insieme infinito. 
*X ammette un x-elemento non standard. To e, 

PROPOSIZIONE. Sia *U un allargamento di U e XeM un insieme infinito. 
X ammette un sottoinsieme esterno. 


Il fatto che in un allargamento tutte le relazioni concorrenti ammettano una 
«soluzione globale» è una proprietà molto forte. In particolare, se X è un in- 
sieme infinito di UU, la relazione xey (ove y è un sottoinsieme finito di X) 
è concorrente. Dunque esiste in *U un insieme *-finito che contiene X: ogni 
entità infinita di AU può essere immersa in una entità *-finita (dello stesso tipo) 
di *U. Ciò è cruciale per comprendere la «relativizzazione» dell’opposizione 
finito infinito. 


3. Analisi non standard. 


A questo punto si dispone di abbastanza strumenti per mostrare come la- 
nalisi possa essere riformulata nello stile di Leibniz. Non si tratta però in due: 
sta sede di dare un’esposizione teorica dei risultati ottenuti con questo metodo; 
ci si limiterà dunque ad illustrare con qualche esempio come l’uso di modelli 
non standard [per le basi dell’analisi non standard cfr. Robinson 1961 e 1966; 
Machover e Hirshfeld 1969; Luxemburg 1973] di R consenta: 


a) di semplificare considerevolmente i concetti di base dell’analisi classica e 
della topologia generale; NEGA l 

b) di chiarire concettualmente certe intuizioni paradossali; 

c) di «riportare » l’infinito al finito; “n 

d) di fornire una rappresentazione per alcune costruzioni molto astratte. 


Tali diversi risultati si collocano a livelli di difficoltà eterogenei. Nei casi 
semplici saranno ripresentati i risultati classici. In quelli più complessi verran- 
no supposti acquisiti. j 

Ma prima di arrivare ad essi, ecco un risultato negativo. 
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3.1. La limitazione interna dell'analisi non standard. 


A priori, poiché un modello non standard (d’ora in poi abbreviato n. s.) 
*R di R è un'estensione elementare (in senso proprio) e poiché la sua teoria fa 
intervenire il simbolo supplementare +, si potrebbe credere che l’analisi n. s. 
sia una teoria «più forte» dell’analisi standard. Nulla di tutto ciò. Sia S il siste- 
ma formale che codifica la pratica dell’analisi standard: $ è essenzialmente il 
linguaggio della teoria degli insiemi (teoria dei tipi) dotato dei suoi assiomi, 
dello schema di induzione e dell’assioma della scelta. Sia MS il sistema formale 


che codifica la pratica dell’analisi n. s.: MS è esteso in modo essenziale grazie , 


all’aggiunta del nuovo simbolo #, del rafforzamento dello schema d’induzione e 
dell’assioma della scelta, dell’assioma affermante che i modelli n. s. sono esten- 
sioni elementari, di quello affermante che tali estensioni sono estensioni proprie, 


di quello, infine, che definisce gli allargamenti. Kreisel [1969] ha mostrato il 
seguente risultato di limitazione: 


TEOREMA. L'estensione NS di $ è inessenziale (conservativa): ogni formula 
di S derivabile da NS è derivabile da S. 


Questo risultato, se mostra che l’analisi n. s. si riduce a una «riformulazio- 
ne» dell’analisi s., non limita tuttavia per nulla la sua portata euristica e stra- 
tegica. È proprio a questa che sono dedicate le pagine seguenti. 


3.2. *N e *R. 


Sia *N un modello n. s. di N. (N<*N può essere ottenuto come ultrapo- 
tenza dall’esempio di p. 487). Per il teorema di p. 493 il sottoinsieme *NN\N 
degli interi «infiniti» (infiniti relativamente a N) di *N è esterno. La stessa cosa 
accade per N. i 

Poiché N e *N hanno la stessa teoria, per distinguerlì si ricorre al loro tipo 
d'ordine. Siccome l’enunciato «Non esistono interi fra n e +1) è del primo 
ordine, è valido in *N. N è dunque un segmento iniziale di *N (tutti gli ele- 
menti di *N\N sono maggiori di tutti gli elementi di N, sono cioè infiniti). 

Si consideri su *N la relazione ad se e solo se la—b| N. È una relazione di 
equivalenza che scompone *N in classi di equivalenza (la classe individuata 
da o è N tutto intero). Sia G, la classe di equivalenza di ae *N. G, è un inter- 
vallo. Se infatti awd (cioè be G,) e a<c<b, allora ancob (cioè ceG,). Se 
ae*NXN, G, ha il tipo d’ordine ©*+ di Z. L’ordinale a di *N è dunque di 
tipo a=%+(0*+)9, dove 9 è un ordinale dipendente da *N. (Come d’uso, 
Si è indicato con « il tipo d’ordine — l’ordinale - di N; ©* è il tipo dell’or- 
dine inverso). 

Sussiste il teorema: 


TEOREMA (Henkin, Kemeny). 9 è denso senza primo ed ultimo elemento. 


Per avere una ‘descrizione più fine di #N, si può considerare una ultrapo- 
tenza NN/D (dove D è un ultrafiltro libero su I =N) e studiare come i numeri 
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di tipo *f(a) (in cui f : N+N è una funzione standard) si distribuiscono in *N. 
L'idea è di raggruppare fra di loro gli elementi di N = *N\N che sono re- 
ciprocamente accessibili [cfr. Puritz 1972] mediante le *f e di leggere nella 
struttura di N., certe proprietà dell’ultrafiltro D associato a *N. Ma non si 
approfondirà qui tale punto. 


Si consideri ora la struttura di un modello n. s. *R di R. Si osservi anzi- 
tutto che R può essere ottenuto a partire da un modello n. s. di Q. Sia 
infatti *Q un allargamento di Q. In primo luogo nella estensione *Q di Q tutte 
le «sezioni» di Q - cioè le coppie (Di, D3) di sottoinsiemi di Q tali che 
D,<Ds- sono «riempite»: se Dj<D, è una sezione, esiste un ye *Q tale che 
D,<y<D, Infatti la relazione «xeD,UD, e esiste un y tale che x<y se 
xe D, o y<x se xe Dy» è banalmente concorrente. Ammette dunque una «so- 
luzione globale» in *Q poiché *Q è un allargamento. 

Sia allora *Q; l’insieme degli elementi finiti di *Q cioè l'insieme degli 
xe *Q tali che esiste un ye Q con |x|<|y]. *Q; è un sottoanello del corpo *Q. 
Non è un corpo poiché esso contiene degli infinitesimi i cui inversi sono «in- 
finiti». Sia p. l'insieme degli infinitesimi di *Q. È facile verificare che u è un 
ideale di *Q; (la differenza di due infinitesimi è infinitesimale e il prodotto di 
un infinitesimo per un numero finito è infinitesimale). 


PROPOSIZIONE. R=*Q/u. 


Dimostrazione: Per costruzione, *Q;/u «completa» Q, cioè « riempie» le 
sue lacune. D'altra parte Q è denso in *Q;/u. R è il solo corpo ordinato com- 
pleto nel quale Q sia denso. 


Sia dato ora un modello n. s. *R di R. *R è un corpo ordinato che non è ar- 
chimedeo relativamente a N ma che è archimedeo relativamente a *N. Come già 
si è detto, è equivalente affermare che R è archimedeo e che R non contiene in- 
finitesimi. *R contiene dunque infinitesimi relativamente a R, ma non relati- 
vamente a *R. : 

Sia *R; l'anello degli elementi finiti di *R e u l’ideale di *R; costituito da- 
gli infinitesimi di *R. Si ha allora la proposizione seguente: 


proposizione. *R;/u=R. 


Dimostrazione: Sia dato un xe *R, e si indichi con #=x+w la sua classe 
di equivalenza. # contiene uno e uno solo reale standard st(x). 

a) Se st(x) esiste è unico. Siano dati infatti y,zeRN# e si supponga 
yz. Allora |y_—z|ép, cioè y e # non sono equivalenti. Contraddizione. y= 2. 

b) st(x) esiste. Si consideri infatti ae #. Sia a standard e allora si conclude. 
Sia & non standard e si divida R in due classi Dj e D,: Di={yeR|y<a} e 
D,={yeR|y>a}. D3 è non-vuota poiché x è finito per ipotesi. D, è non-vuo- 
ta poiché se ]a|<m, —meD,. In più D,<D,. (D,, D3) è dunque una sezione 
di Dedekind che definisce un numero reale reR. Occorre mostrare che re $. 


[I 


Si supponga per esempio che r=maxD; (la dimostrazione è la stessa per 
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r=minD). Siccome 4 non è standard, a—r>o. Se a—-réy, esiste un $>o 


tale che a—r=>$. In questo caso a>r 
: +(3/2) e dun 
r<maxD,. Contraddizione. a—reu, cioè i LL que 7+($/2)eD, e 


È b n sai . a 
anale verificare che la biiezione st : *R;/u+R è un morfismo di corpi. 


DEFINIZIONE. Si chiama parte standard di x e *R i indi ) 
e la si in i - 
mero reale st(x). ; TE 
DEFINIZIONE. Se xe*R, si chiama monade di x, e si indica con u.(x), il traslato 
x+u dell’ideale x degli infinitesimi (monade di ©). 


Osservazione: Si ritrova proprio la struttura di *R anticipata a p. 465 


PROPOSIZIONE. Ì sottoinsiemi * *R_= * i ; 
esterni. emi R, R,, R.=R\ R,, u(x) di *R sono tutti 


Dimostrazione: Se R fosse interno, N=RM* ivar 
mo , N=RM*N lo sarebbe relativamente a 
- Lo è escluso dal teorema c) di p. 493. La stessa cosa accade per *R, poiché 
su i Poiché *R. n il complementare di *R, è esso stesso interno 
o a u.(x) si supponga che esista un 4e *R tale che ia int | 
u= 0 sarebbe interno cosi che *R,,=yu-!. TO 
i dànno ora. alcune indicazioni sulla struttura non più di *R di 
; ndic ma di *R. 
da G,la cosiddetta galassia di un elemento xe *R, cioè Goo {ye *R| x- dr R} 
a een di 0, Go, è l'anello *R,. Si può considerare il gruppo additivo ordi- 
pv di galassie R/G, e inoltre il gruppo additivo ordinato delle monadi 
lu; si indichi con *R+ il gruppo moltiplicativo ordinato degli elementi stret- 
tamente positivi di *R. Due elementi x,ye *Rt sono detti dello stesso ordine 
di grandezza se il loro quoziente è finito ma non infinitesimale: (x/y)e G Nu 
L’ordine di grandezza è una relazione di equivalenza. Si indichi con R "n 
la classe d’equivalenza di ac*R*: ponendo y=1, si vede che R, è esatta- 
pe parte positiva di GN R, è un sottogruppo moltiplicativo ordinato 
1 : Il gruppo moltiplicativo ordinato quoziente *R+/R, è detto gruppo di 
valutazione di *R. Sussiste il teorema seguente: 
TEOREMA (Zakon). 
1) *R/G,=*Rt/R,. 
2) *R/ Go e *R*/R, sono divisibili, non archimedei, con ordine denso e total- 
mont incompleti (vi esistono delle lacune în ogni intervallo aperto). 
3) pia è d de 9% ; 1+% in cui 2 è l’ordinale che definisce il tipo di 
me a=+(0*+0)9 di *N (cfr. : i i Ki 
o regioni (cfr. sopra, p. 495, il teorema di Henkin 


i Sabra Siano è, *ò, da e È, gli ordinali rispettivi di R, *R, Go= *R, 


I) #0=3e(9*+1+9) de=dud = du=dgd+1+309*. 
2) *R, u e *R;=G, sono totalmente incompleti e non archimedei. 
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3.3. Elementi di analisi classica. 


L’analisi n. s. permette di riformulare in modo intuitivo («geometrico » re- 
lativamente alla «fibrazione » di *R operata dalle monadi) i concetti e i teoremi 
dell’analisi classica. Eccone alcuni esempi. 


Successioni. Sia S= (Sn)nen Una successione di numeri reali. 


DEFINIZIONI. 1) Si dice che S è limitata se esiste un MeR tale che |s,| <M 
per ogni neN. 2) Si dice che S ammette s come limite (lims,=s) se per ogni 
e>o esiste un NeN tale che n>N implica |s,-s|<&. 3) Si dice che seR è un 
punto limite (o punto di accumulazione) di S se per ogni e>o e per ogni NeN 
esiste un n>N tale che |sj-—s|<e£. 


Queste definizioni classiche sono formulate nello stile Cauchy-Weierstrass. 
Ma una successione S di numeri reali è un’applicazione S:N+>R; essa si 
estende dunque automaticamente a un modello n. s. *R di R in una successione 
x-numerabile *.S : *N-*R. Si denoterà ora con w un intero infinito qualun- 
que di *N_=*NX\N. 


PROPOSIZIONE. La successione S= (s,),ex è limitata se e solo se s,, è finito 
per ogni we *N.,. 


Ne è agevole la dimostrazione. 

PROPOSIZIONE. lims,=s se e solo se s, <s per ogni we *N., (dove x=y 
denota «x e y sono infinitamente. vicini »). 

Dimostrazione: Si supponga limsn=s e si voglia mostrare che per ogni 
e>o (ceR) e per ogni We Nu, [Sy S| <E fimsn=s si esprime, come si è 
detto sopra, con l’enunciato: 

(1) Ve>o UNeN(1>N=>]|sn—-s|<e) 

Dato e>o, sia N l’intero standard di cui la (1) afferma l’esistenza. L’enunciato 
(2) n>N=|s,—s|<€ 

è valido in R e dunque in *R. Siccome ©>N per ogni NeN, |s,—s|<£- 


Viceversa, si supponga s,2s per ogni we *N... Siano e>o (eR) e we *N.. 
L’enunciato 


(3) Vu(n>w=>|sn—-s|<£) 
è valido in *R. Esso non è definito in R a causa della costante w. Ma l’enun- 
ciato 


(4) Uwo Va(n>w=>|s,—-s|<e) 
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è definito in R e valido in *R. È dunque valîdo in R ove può essere riscritto 
con IN Va(n>N>|s,—-s[<e). 


Nello stesso spirito, si può dimostrare anche la proposizione seguente: 


PROPOSIZIONE. I punti limite di S sono le parti standard %s,, degli s,, finiti. 


Banalizzazione del teorema di Bolzano-Weierstrass. Un importante teore- 
ma sulle successioni è quello di Bolzano-Weierstrass. Esso afferma che se una 
successione è limitata, allora ammette un punto limite. Tale teorema è fonda- 
mentale nella misura in cui si nota che è alla base della nozione di compattezza 
in topologia generale (cfr. oltre, p. 503). La sua dimostrazione nello stile Cau- 
chy-Weierstrass è elementare ma non è affatto banale, non deriva cioè diretta- 
mente dalle definizioni. 

Se invece si prendono come nuove definizioni le caratterizzazioni n. s. pre- 
sentate sopra (pp. 498-99), questo teorema diventa banale. 


TEOREMA DI BOLZANO-WEIERSTRASS. Se una successione è limitata, essa am- 
mette un punto limite. 


Dimostrazione: Se .S è limitata, s,, è finito per ogni we *N... Sia dato un 
we *N., s=%s, è un punto limite di S, 

Generalmente molti risultati si «banalizzano» nella analisi n. s. ricondu- 
cendoli a proprietà puramente insiemistiche delle monadi. 


Il criterio di convergenza di Cauchy. Il celebre criterio di convergenza di 
Cauchy afferma che una successione converge se la differenza dei suoi termini 
si annulla all’infinito. Eccone una dimostrazione n. s. 


TEOREMA. Una successione S= (sn)nen converge se e solo se lim (s,—s5n)=0. 
N, Mtoo 


Dimostrazione: lim (s,—sm)=0 si riformula in termini n. s. nell’enunciato 
N, M+o0 
(5) SuSy 


per tutti i p,ve*N... Si supponga che S converga e abbia limite s. s,,=5 
per ogni we *N., e dunque la (5) è valida. Viceversa si supponga che essa sia 
valida. Se si mostra che per ogni we *N.., s,, è finito, allora tutti gli s,, hanno 
la stessa parte standard s e S converge verso s. Sia dunque we *N., e si suppon- 
ga s,, infinito. Si consideri l’insieme A={ne *N ||s,—sn|<1}. A è un insieme 
interno. Ma A=*N., poiché 1) essendo s,, infinito ed essendo s, finito per 
neN, AC*Nu; 2) se pe*N.., s,5, per ipotesi e dunque |s,—sp|<1. Ora 
per il teorema di p. 493 *N.. è esterno. Contraddizione. s,, è sempre finito e S 
converge verso %s,,. 


Continuità. Sia data una funzione f : R+R. Essa si prolunga automati- 
camente a una funzione *f : *R+ #R, 


PROPOSIZIONE. f è continua in xy se e solo se x=x, implica *f(x)=f(xo). 
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Dimostrazione: Per definizione f è continua in x se dim f(x) =f(x), cioè 
(nello stile Cauchy-Weierstrass) se l’enunciato o 
(6) Ve>o Hi>o Va(la—xo|<d > |f(2)-f(x)|<£) 
è valido. Se f è continua in x, poiché la (6) è valida in R, è valida in *R. Sia 
dato un xe *R tale che xx. |x-xo|<d per ogni $>o ($eR) e dunque 
|*f(e) -f(x)j<e per ogni e>o (ceR) cioè *f(a)=f(x0). ; 
Viceversa, se per ogni x>x (xe *R) *f(x)=f(x0), per e>o e hey l’enun- 
ciato 


(7) Va(lx—xo| <A> |*f(x)-f(xo)}<e) 


è valido in *R. La (#7) non è definita in R a causa della costante 4. Ma l’enun- 
ciato 
AI Valex] <A> |f() f(x) <8) 


è definito in R e valido in *R. Di conseguenza è valido in R. 

Osservazione: Questa proposizione permette di «visualizzare» (e dunque 
di rendere concettualmente intuitiva) la proprietà non intuitiva di continuità. 
f:R+R è continua se per ogni xeR *f(u(x))Cu(f(x)), cioè se *f rispetta 
la «fibrazione» di *R operata dalle monadi (cfr. fig. 9). 


Derivabilità. PROPOSIZIONE. f è derivabile in x, se tutti i quozienti 
bri ii AG 
x—%X0 


in cui xep(x,) hanno la stessa parte standard (indicata con f'(xy): derivata 
di f in xy). 
Dimostrazione: f è derivabile in x, se il limite 
° x)-f(x ; 
a+, X—Xo 


esiste. La dimostrazione è analoga a quella della proposizione di p. 498. 


PROPOSIZIONE. Se f è derivabile in xy, essa è continua in xy. 


Ml rio 
(a * 
x x 
R x — e {(x) R 
f 


Figura 9. 
«Visualizzazione » della continuità. 
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Dimostrazione: Per ogni xo&xo, x, *f(x)=f(x0) poiché *f(x) f(x) = 
=f (x) (xx) 

Osservazione: La derivata è dunque in un certo senso proprio il quoziente 
df/dx; ma poiché tale quoziente può essere n. s., di fatto viene identificata con 
la sua parte standard. È contraddittorio imporre che il quoziente di due infini- 
tesimi sia sempre standard. Proprio tale inconsistenza è all'origine della rimo- 
zione dell’infinitesimale leibniziano. 


Differenziali. A questo punto si può riprendere la caratterizzazione del 
dx leibniziano come simbolo-indice «dimezzato » che era all’origine del chiari- 
mento logico-concettuale del paradosso dell’infinitesimale. Sia dx il simbolo- 
indice associato all'insieme u degli infinitesimi di *R. Siccome 4tOR= (0), 
dx non può riferirsi che a o in R: dx è cosi «dimezzato» relativamente a R. 
Ma relativamente a *R è un simbolo-indice consistente analogo a una costante 
per quel che concerne il simbolo e analogo a una variabile per quel che con- 
cerne l’indice. 

Sia f:R+R una funzione derivabile in x. Sia df=*f(x0+dx)—f(x0). 
Poiché i quozienti di infinitesimi df/dx hanno tutti la stessa parte standard, è 
possibile separare l’aspetto-simbolo e l’aspetto-indice del dx e supporre indif- 
ferentemente che dx è o un infinitesimo particolare o un simbolo di variabile 
per gli elementi di p. 


3.4. Topologia generale. 


Alla fine del x1x secolo e all’inizio del xx lo studio di spazi molto differenti, 
e in particolare degli «spazi» di funzioni, ha condotto ad astrarre e ad assio- 
matizzare il concetto di topologia o meglio il concetto di intorno. Si dànno qui 
per noti i necessari riferimenti metrici e topologici (si veda l'articolo « Geome- 
tria e topologia» in questa stessa Enciclopedia). Sia X uno spazio topologico. Sia 
3 (x) l'insieme degli intorni di xe X. È facile verificare che F (x) è un filtro. 
In generale, tale filtro non ammette un più piccolo elemento (non è princi- 
pale). Quando x varia, i filtri $(x) non sono indipendenti. Se U è un intorno 
di x, U è infatti un intorno di ogni punto y «abbastanza vicino» a x: per ogni 
e3(x) esiste un VeF(x) tale che UeF(y) per ogni ye V. 

A partire dalla nozione di topologia molte altre nozioni s'impongono pres- 
soché da sole. Si dirà per esempio che un punto x è isolato se il filtro dei suoi 
intorni è l’ultrafiltro principale F,={UCX|xe U}. Si dirà che la topologia 


© è separata se è sempre possibile «separare» due punti differenti, cioè se per 


tutti gli x4y esistono intorni disgiunti Ue F(x) e Ve 3(y) di x e y. Si dirà che 
una successione (x,)nen di punti di X converge verso x (ammette x come li- 
mite) se per ogni intorno aperto UeF(x) esiste un NeN tale che per ogni 
n>N, xy U. Si dirà che x è un punto limite di (x,),en se per ogni intorno aper- 
to Ue F(x) e per ogni NeN esiste un > N tale che x,€ U. Si dirà che un’ap- 
plicazione f : X-+Y tra due spazi topologici è continua se l’immagine reci- 
proca di ogni aperto di Y è un aperto di X, ecc. 
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Si vedrà come tutte queste nozioni di base cosî come i teoremi caratteristi- 
ci ai quali dànno luogo siano riformulabili in modo puramente insiemistico 
nell’analisi n. s. 


Sia (X, €) uno spazio topologico e si consideri un allargamento dell’uni- 
verso di base X. © è un insieme di sottoinsiemi di X. Sia *© la sua esten- 
sione n. s.; essendo *© una entità standard, i suoi elementi sono interni. 

Sia xe X e F,, il filtro degli intorni (aperti) di x. La nuova entità che il mo- 
dello n. s. consente di introdurre e di maneggiare è essenzialmente la mo- 
nade di x. 


DEFINIZIONE. Sia xe X. La monade u(x) di x è l'intersezione degli *U per 
UeT,: u(a)= (YU. 

. Des, 

In generale non esistono intorni di x «più piccoli» (questo è un altro modo 

di dire che il concetto fondamentale dell’analisi è quello di limite). Ma si vedrà 

che in *X esistono «*-intorni» più piccoli di tutti gli intorni di x in X. Ciò 

permetterà di ragionare «insiemisticamente» riportando le proprietà «infinite- 


simali» in X a proprietà «finite» in *X. 


LEMMA FONDAMENTALE. Se *X è un allargamento di (X,T) e se xe X, esiste 
un Ve*C tale che xeVeu(x). 


Dimostrazione: Si consideri la relazione binaria di dominio ©, R(U,V): 
«xe Ve Ub». Poiché l’intersezione di un numero finito di aperti contenente x 
è un aperto contenente x, R(U, V) è concorrente. Ammette dunque una «so- 
luzione globale» Ve *È tale che xe VC*U per ogni Ue6, xe U. Siccome 
k()= MU, se Veu(x). 

Ue 
we 
Ecco ora la caratterizzazione degli aperti. 


| PROPOSIZIONE. U è aperto se e solo se *U contiene la monade di ciascuno 
dei suoi punti. 


Dimostrazione: Se U è aperto, per ogni xe U, Ue 3, e dunque u(x)= 


= (\*Uc*U. Viceversa, sia xe*U. Siccome u(x)c*U, l’enunciato HVe 
Ues, È n n ‘ 5 
eF, (VC U)è valido in *X. È dunque valido in X. U è un intorno di x, dun- 


que di ciascuno dei suoi punti, dunque aperto. 
coRrOLLARIO. F è chiuso se per ogni xéF, u(x)N*F= @. 


DEFINIZIONE. Se A è un sottoinsieme qualunque di X, si dice che un punto xeX 
è aderente a A se ogni intorno di x interseca A. Si chiama aderenza di 4 e si in- 
dica con A l'insieme dei punti aderenti ad A: essa è la chiusura di A cioè l’inter- 
sezione (che è un chiuso) dei chiusi contenenti A. 


Si ha allora la seguente proposizione: 


PROPOSIZIONE. Sia ACX, xe 4 se e solo se u(x)N*A# 9. 
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Ecco, sempre a titolo d’esempio, la caratterizzazione della proprietà di se- 
parazione. 


PROPOSIZIONE. La topologia © su X è separata se e solo se le monadi di 
due punti differenti sono sempre disgiunte. 


COROLLARIO. Se X è separato, ogni punto xe *X appartiene al massimo 
a una monade. Se xepu(°x) si dice che °x è la parte standard di x. 


Si caratterizza infine per un punto la proprietà di essere isolato. Un punto 


xe X è isolato se e solo se u(x)={x}. Ma Robinson ha dato una caratterizza- 
zione più forte.’ 


TEOREMA. x è isolato se e solo se la sua monade p.(x) è interna. 


Si riesamini ora il tema della compattezza cui ci si era accostati in rife- 
rimento alla banalizzazione del teorema di Bolzano-Weierstrass. Gli insiemi 
compatti sono gli insiemi chiusi che soddisfano la proprietà che ogni succes- 
sione di punti ammette un punto limite. Intuitivamente, essi sono degli spazi 
abbastanza «finiti» da non consentire di «collocarvi» un insieme numerabile di 
punti senza «accumularli» in qualche parte. Vista la loro importanza, la ten- 
denza è stata di caratterizzarli con una proprietà di finitezza della loro topolo- 
gia (dei loro aperti) e dimostrare a posteriori un analogo del teorema di Bol- 
zano-Weierstrass. L’analisi n. s. banalizza a sua volta la loro definizione e la 
loro proprietà caratteristica. 


DEFINIZIONE. Uno spazio topologico separato (X, TC) è detto compatto se da 
ogni ricoprimento di X con degli aperti è possibile estrarre un sottoricoprimento 
finito. 

DEFINIZIONE. Sia (X, È) uno spazio topologico. Un punto x di *X è detto 
quasi standard (‘q. s.) se appartiene alla monade di un punto standard. Si indichi 
con *Xx.s. l'insieme dei punti quasi standard di *X: *Xs. UH). 


TEOREMA (caratterizzazione n. s. della compattezza). Sia X uno spazio se- 
parato, X è compatto se e solo se *X=*X.s. cioè se e solo se ogni punto non stan- 
dard è quasi standard. 


Dimostrazione: Si supponga che X sia compatto e che esista un xe *X 
che non sia quasi standard. Per ogni ye X esiste dunque un aperto ye U tale 
che xé *U. Sia U= {U,} l'insieme degli Ve® tali che x€ *U. ÙU è un ricopri- 
mento aperto di X. Poiché X è compatto, è possibile estrarre un ricoprimento 
finito U,, ..., Ux. Ma poiché U,U...UU,=X è un enunciato del primo or- 
dine, *U,U...U*U,=*X. Ora xé*U,U...U*U,. Contraddizione. Ogni pun- 
to di *X è quasi standard. 

Viceversa si supponga X non compatto. Esiste un ricoprimento aperto U 
di X tale che per ogni sottoricoprimento finito U;, UU;#X. Si consideri la re- 
lazione R(U, y): «Ue%U, ye X, y&U». Essa è concorrente. Poiché *X è un 
ullargamento, essa ammette una «soluzione globale» xe *X: per ogni UeU, 
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+ x€*U. x non è quasi standard poiché se ye _X, esiste un UU tale che ye U 


e siccome x&*U, xéu(y). 


COROLLARIO. Un sottoinsieme K di X è compatto se e solo se ogni punto 
di *K appartiene alla monade di un punto di XK. 
PP is 


La proprietà classica per un compatto di essere chiuso si riconduce a banali 
proprietà insiemistiche delle monadi. 


PROPOSIZIONE. Sia X uno spazio separato, se K CX è compatto, K è chiuso. 


Dimostrazione: Come si è visto sopra, K è chiuso se e solo se, per ogni 
x€K, u(x)N*K= @. Sia dunque dato un xé K e si supponga che esista un 
yeu(x)N*K. Siccome K è compatto esiste uno ze K tale che yeu(z). Si ha 
dunque yeu(x)Np(2) cioè u(x)Np(2) 4 D e xe K e ze K cioè x342. Siccome 
X è separato si dovrebbe ottenere u(x)Nu(2)=@. Contraddizione. (x) 
N*K=@ per ogni x&X e K è chiuso. 

Si banalizzi ora il teorema di Bolzano-Weierstrass. In modo analogo a 
quanto si è fatto a p. 499, dapprima si mostra: 


PROPOSIZIONE. Sia (%,),ey una successione di punti di X (separato): x è 
un punto limite di (x,),.n se e solo se esiste un we *N,, tale che x,,Eu(x). 


COROLLARIO (teorema di Bolzano-Weierstrass). Se X è compatto ogni suc- 
cessione ammette un punto limite. 


Dimostrazione: Sia (x,)pen una successione di punti di X e sia we *N, 
un intero infinito. Siccome X è compatto, x,, è quasi standard: esiste un xe X 
tale che x, ep(x). Per la proposizione esposta sopra, x è un punto limite di 
(n)neN- 

Osservazione: La caratterizzazione n. s. della compattezza «banalizza» la 
definizione standard nella misura in cui riduce il livello (nella gerarchia dei 
tipi) delle entità messe in gioco. Come osservano Machover e Hirshfeld, «se 
i punti (e gli »-punti) sono pensati come oggetti di tipo o, gli insiemi di punti 
come oggetti di tipo 1 e le famiglie di tali insiemi come oggetti di tipo 2, allora 
la definizione standard di compattezza è un enunciato universale-esistenziale 
che comporta oggetti di tipo 2 e che fa uso della nozione di oggetto finito di tipo 
2 (‘‘per ogni ricoprimento aperto di A esiste un sottoricoprimento finito’). 
D'altra parte, la caratterizzazione non standard è formulata come un enunciato 
universale-esistenziale che comporta soltanto oggetti di tipo o. È tutto molto 
semplice da usare e da visualizzare. La maggior parte delle dimostrazioni che 
comportano argomenti di compattezza è più diretta, semplice e naturale quan- 


do vengono usati i metodi non standard» [1969, pp. 30-31]. 


Questi pochi esempi di topologia generale sono sufficienti a mostrare la 
portata euristica e pedagogica dell’approccio n. s. Prima di ampliare ulterior- 
mente le loro applicazioni, si delineano alcune problematiche a cui si aprono 
in modo naturale. 
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Prima di tutto è chiaro come la nozione di monade definita a partire dai 
filtri di intorni possa estendersi a un filtro qualunque. 

Sia 3 un filtro su un insieme X composto di entità di un tipo dato o. Si 
chiamerà monade di F e si noterà con p(3) la +-entità di tipo (0) definita da 


u(3) 2002 


A partire da questo punto, è possibile proporsi una teoria generale delle 
monadi [cfr. Luxemburg 1969]. Ecco alcune indicazioni. 

Si generalizza il lemma fondamentale di p. 502: u(3) è la riunione dei 
Ve*3 tali che Vcu(3). Si generalizza la caratterizzazione del teorema delle 
monadi interne (p. 503): 


, TROREMA (Luxemburg). Sia $ un filtro su X, e sia *% un allarcamento del- 
l'universo U cui appartiene X. La monade p.(3) è interna se e solo se 3 è principale. 


Dato un insieme (2 qualunque (interno o esterno) di entità di *U di tipo 
(0), sia Fo il filtro degli insiemi A di entità di tipo o di U tali che QC*A. Si 
chiama monade discreta di Q e si indica con py(9) la monade del filtro To 
Wa(02) è un modo di rappresentarsi l’allargamento U<*U, 

Si indichi con M, l'insieme «completo» delle entità di tipo o di U. ug è 
un operatore definito sull’insieme 9(*M,) delle parti di *M,. 


PROPOSIZIONE. L'operatore uj è un' operatore di chiusura: 


1) da(D)=W e pa(*M,)=*M,, 

2) Per ogni QC*M,, QCua(Q). 

3) ta(a(Q))=pa(0) (idempotenza). 

4) ta(Q2U09,)= ua(Q) Upg (9) (distributività rispetto alle riunioni finite). 


Ora, in modo molto generale, se (X, ©) è uno spazio topologico l’opera- 
tore x definito su P(X) e che associa a ogni sottoinsieme AC X la sua aderenza 
À € un operatore di chiusura. Viceversa si mostra che se x è un operatore di 
chiusura su P(X), esso definisce una topologia su X attraverso i chiusi a(A). 

L'operatore pa definisce dunque una topologia su M, per la quale QCM, 
è chiuso se Q è la monade di un filtro. È 


DEFINIZIONE. .St chiama S-topologia la topologia definita da Ha- 


x 


Poiché la S-topologia non è caratterizzata che dall’allargamento U<*U, 
la sua analisi permette di studiare anche quest’ultimo. Ecco, per esempio, la 
caratterizzazione topologica delle entità standard. 


PROPOSIZIONE (Luxemburg). Sia QC*M,. Q è standard se e solo se Q è 
nello stesso tempo S-aperto e .S-chiuso. 


Un'altra problematica che emerge naturalmente è la seguente. 

Se (X, È) è uno spazio topologico si possono definire le monadi u(x) dei 
punti di X. Viceversa ci si può proporre di dotare X di una struttura «mona- 
dica» e di analizzare il rapporto di tale struttura con una struttura topologica. 
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Tale strategia è pertinente nella misura in cui si constata che nozioni topolo- 
giche sofisticate e apparentemente non naturali divengono cosî molto naturali. 
A tal proposito si ricordano brevemente alcuni risultati di Puritz [1976]. 
Sia dato un insieme X e, per ogni xe X, si consideri la «monade» xe u(x) 
che rappresenta a priori i punti di *X «infinitamente vicini» a xe X. Tale 
struttura è detta quasi monadica e viene indicata con @. Sotto quali condizioni 
assiomatiche una data struttura @ è equivalente a quella di una topologia? 


PROPOSIZIONE. Sia 9 una struttura quasi monadica su _X. Sono equivalenti 
le condizioni: 


1) @ soddisfa l'assioma gg: per ogni xe X, u(x) è la monade di un filtro, 
e p è equivalente a una pretopologia © su X. Si dirà allora che gp è mo- 
nadico. 

2) © soddisfa inoltre l’assioma @y: per ogni ye *X, ye u(x) implica *u (9) C 
Cp(x), e la pretopologia È è una topologia. 

3) © soddisfa inoltre l'assioma 44: per ogni ye *X, yé u(x) implica *u(9)N 
Nu(x)= 2 e la topologia © è regolare. 

4) © soddisfa inoltre l'assioma 9;: per ogni y,ze*X, *u(M0*u(2)=@ 
implica che esiste un ue *X tale che ye*u(u) e ze *u(u), e la topologia 
© è normale. 


Osservazione (definizioni): 1) si dice che una topologia (X, È) è regolare 
se, per ogni xe X, gli intorni chiusi di x generano il filtro degli intorni F,; 
2) si dice che una topologia (X, ©) è normale se la proprietà di separazione è 
valevole non soltanto per i punti ma per i chiusi in generale: se A e B sono dei 
chiusi disgiunti di X si può «separarli» con degli aperti UD A e V>B disgiunti. 

Osservazione (sul simbolo *u): *u è una estensione di p. che non si può 
supporre acquisita a priori poiché le y.(x) non sono standard. Essa viene de- 
finita nel modo seguente. Sia F un filtro su X. È naturale dire che F converge 
verso xe X se u(7)Cu(x). Sia allora xe X e sia D, l'insieme degli ultrafiltri 
convergenti verso x. Poiché D, è una entità standard, si applica a *X. Sia allora 
8 un «-filtro. La sua parte standard 98, insieme degli UCX tali che *Ue$, 
è un filtro su X. Se ye *X allora si pone *u(y)= UU t.(°8). Poiché la costru- 

co) 


zione delle monadi è stabile per riunione, *u(y) è sempre una monade di un 
filtro. Ma è possibile avere per x standard u(x)#*u(x). 

L'interesse di tale approccio è che è possibile indebolire naturalmente la 
nozione di struttura monadica in quella di struttura quasi monadica che soddi- 
sfa l'assioma (più debole di ;) g,: per ogni x, y(x) è una quasi monade. 


DEFINIZIONE. Sia xe *X, la monade discreta 1a (x) è la monade dell’ultra- 
filtro U,={UCX|xe*U}. Si indichi con = l’equivalenza definita su *X da 
x=y se e solo se U,=%U, (e dunque u3(x)= da (0). Un sottoinsieme QC*X è 
detto saturato o quasi monadico se è saturato per l'equivalenza =: per tutti gl 
a,ye*X, xe e x=y implica yeQ. 
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Sia 9 una struttura quasi monadica su X. Si indichi con 1,(x) (rispettiva- 
mente 0,(x)) l'insieme dei filtri di X (rispettivamente degli ultrafiltri) conver- 
genti verso x. Si definisce il filtro N, degli «intorni» di x come l’intersezione 
dei filtri di 7,(x) (e di py(x)). Sia U l'insieme degli insiemi di ultrafiltri su X. 
@ definisce un’applicazione py : x+py(x) di X in. 


PROPOSIZIONE. L'applicazione p, : X-+U soddisfa le proprietà: Po) per ogni 
xe X l’ultrafiltro principale F 2={UCX|xe U} appartiene a py(x); P,) un fil- 
tro 3 su X converge verso x se e solo se l’insieme Us degli ultrafiltri che raffi- 
nano 3 è incluso in p,y(x). 


Le strutture di convergenza su X definite da un’applicazione p : X+U che 
soddisfa gli assiomi P;) e P,); sono state introdotte (nel quadro della topo- 
logia generale standard) da Choquet col nome di pseudotopologie. Si tratta in 
tal caso di una nozione sofisticata che diviene molto naturale nella sua for- 
mulazione n. s. 


COROLLARIO. Se © è una struttura quasi monadica, py è una pseudotopo- 
logia. 


È possibile mostrare anche il risultato più forte: 


TEOREMA (Puritz). La corrispondenza p : +py è una biiezione tra le strut- 
ture quasi monadiche su X e le pseudotopologie su X. 


3.5. Continuità e continuità uniforme. 


È esemplare anche come le nozioni di base di continuità e di continuità 
uniforme si riformulino nell’analisi n. s. 


Continuità. Sia data una funzione f : X+Y tra due spazi topologici. La 
definizione di Cauchy della continuità può cosi essere generalizzata. 


DEFINIZIONE. f è detta continua în xe X se, per ogni intorno aperto V di 
f(x), esiste un intorno aperto U di x tale che f(U)CV. f è dunque continua su 
tutto X se l’immagine inversa di ogni aperto di Y è un aperto in X. 


TEOREMA (caratterizzazione n. s. della continuità). Un’applicazione f : X+Y 
tra due spazi topologici è continua in xe X se e solo se *f(u(a)cu(f(x)). f è 
dunque continua su X se rispetta la « fibrazione » operata dalle monadi. 


Dimostrazione: Si supponga che f sia continua in x. Per ogni intorno aper- 
to V di f(x) esiste un intorno aperto U di x tale che f(U)CV. Dunque 


*f(u(x))<*f(*U)<*V e *f(u(x))cu(f(#)= AR *V. 


Viceversa si supponga *f(u(x))cu(f(2)). Pe il lemma fondamentale di 
P. 502 esiste un-#-aperto U di *X tale che xe Uculx). *f(U)cu(f(x)) poi 
ché *f(u(a))cu(f(x)) e dunque *f(U)c*V per ogni intorno aperto V di f(x). 
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L’enunciato AU(xe U) VV (f(x)e V)(f(U)SV) è dunque un enunciato del pri- 
mo ordine definito in X e valido in *.X. Di conseguenza esso è valido in X. 

Questa caratterizzazione n. s. della continuità consente per esempio di ba- 
nalizzare il risultato classico per cui l’immagine di un compatto in una appli- 
cazione continua è compatta. ° 


PROPOSIZIONE. Sia f : X+ Y un’applicazione continua e sia K un compat- 
to di X. L'immagine f(K) di K è compatta in Y. 


Dimostrazione: È sufficiente mostrare che se 3 è un punto di *f(K) esiste 
un punto y di f(K) tale che zeu(y). Ma se ze *f(K), esiste un xe *K tale che 
2=*f(x). Siccome K è compatto per ipotesi, esiste un ue X tale che xeu(v). 
Poiché f è continua, *f(u(u))Cu(f(u) e dunque *f(x)=zeu(f(0)). 


Continuità uniforme. Si consideri il caso in cui X e Y siano spazi metrici, 
con distanza rispettiva É (x, y) e t(x, y). L’usuale definizione di continuità suo- 
na cost: f : X-+ Y è continua se l’enunciato 


(1) Va,yeX Ve>oUn>o(éÉ(x,y)<n > C(f(a), f(9))<e) 


è valido. Dunque l’n di cui la (1) afferma l’esistenza dipende da x. Quando esi- 
ste una n che non è dipendente da x cioè quando f soddisfa l’enunciato 


(2) Ve>o In>o Va,yeX(E(x,y)<n > Uf(a).f())<a) 


si dice che la continuità di f è uniforme. Questa nozione più restrittiva di con- 
tinuità è facilmente interpretabile in termini n. s. 


x 


TEOREMA (caratterizzazione n. s. della continuità uniforme). f : XY è 
uniformemente continua se e solo se per tutti gli x,ye*X (e non soltanto per tutti 


gli x,ye X) x=y implica *f(x)=*f(9). 


Dimostrazione: Si supponga f uniformemente continua e siano x,pe *A 
tali che xy. Essendo l’enunciato (2) valido in X, esso è valido in *X limi- 
tando la quantificazione su e e agli elementi interni — e dunque standard - 
di *R. Siccome É(x,y)< per ogni n>o poiché x=y, t(*f(®), *f(M)<e per 
ogni e>o e dunque *f(x)=*f(y). La 

Reciprocamente si supponga che, per tutti gli x,ye*X, x=y implichi 
*f(x)=*f(y). Sia e>o. L’enunciato 


Un>o Va,peX(E(x,9)<n > Uf(a).f()<a), 


è valido in *X. Essendo definito in .X, è valido in X. 

Questa caratterizzazione n. s. della continuità uniforme consente di bana- 
lizzare il risultato classico per cui una funzione continua su uno spazio com- 
patto è uniformemente continua. 


PROPOSIZIONE. Sia f : X+Y un’applicazione continua. Se X è compatto, 
f è uniformemente continua. 
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Dimostrazione: Siano infatti x,ye *.X tali che x=y. Siccome X è compat- 
to, esiste per il teorema di p. 503 un elemento standard ze X tale che xay=a. 
Siccome f è continua, per i teoremi della caratterizzazione n. s. della conti- 
nuità *f(x)=*f(y)=*f(z) e f è uniformemente continua. 


Un errore di Cauchy. Sia ora F=(f,)neN una successione di funzioni 
În> XY tra spazi metrici (di distanze & e 7). Si dice che la successione F 
converge verso f se, per ogni xe X, la successione F(x)={f,(x)}nen di punti 
di X converge verso f(x), cioè se F soddisfa l’enunciato: 


(3) VxeX Ve>o INEN (1>N > Cf), f(0))<c). 


L’intero N, di cui la (3) afferma l’esistenza, dipende in generale da x. 
Quando esiste un N che non dipende da x, cioè quando F soddisfa l’enunciato: 


(4) Ve>o HNeN Vxe X(n>N > fa), f(a))<ec) 


si dice che F converge uniformemente verso f. 

Un celebre errore di Cauchy consistette nell'aver creduto di dimostrare che 
una successione convergente di funzioni continue convergesse a una funzione 
continua. L'analisi dei controesempi condusse alla restrizione della convergen- 
za alla convergenza uniforme. 

La riformulazione n. s. permette di vederne chiaramente il perché. 

Dapprima si caratterizza (cfr. il teorema di p. 508) la convergenza uniforme. 


PROPOSIZIONE. Una successione F= (fn)ney converge uniformemente ver- 
so f se e solo se per ogni ye*X e per ogni we*N.., *f()=f.. (9). 


Osservazione: La successione F= (fn)ney converge verso f se e solo se per 
ogni xe X, f.,(x)=f(x) (cfr. sopra, p. 498). 

TEOREMA. .Se la successione di funzioni continue F=(fr)new converge uni- 
formemente verso f, f è continua. 


Dimostrazione: Si deve mostrare che se xe X e ye *.X, y&x implica *f(y) = 
=f(x). Sia dunque ye *X tale che y=x. Siccome f,, è continua, *f, (Pf, (4). 
Siccome F converge a f, f.,(x)=f(x). Siccome F converge uniformemente a f, 
*f(»)=*f(y) per la proposizione appena riportata. Dunque *f(y)=*f. (9) = 
=f.(x)=f(x). Se F non converge uniformemente, non si ha necessariamente 
*f(0)=*f.(y) e non si può dunque concludere. 


3.6. Localizzazione. 


Se (X, È) è uno spazio topologico, la monade (x) di un punto xe X è 
un sottoinsieme (in generale esterno) di #X che svolge il ruolo di intorno infi- 
nitesimale di x. Essa «cattura» per costruzione le proprietà locali di X in x. 
Ciò permette di ridurre considerevolmente la complessità della nozione di 
«locale» che rappresenta uno dei punti cruciali della matematica moderna. 
Si consideri per esempio una funzione f definita su X. «Localizzare» f in x 
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vuol dire considerare la sua restrizione a un intorno «infinitesimale » di x in X. 
Siccome tale nozione è inconsistente in analisi standard, si è stati condotti a 
definire la «localizzazione» di f in x — che viene chiamata germe di f ina- 
con modalità molto sofisticate. Sia T uno spazio di funzioni su X. Di ans 
sce prima una relazione d’equivalenza (dipendente da x e da ©) x a pero 
sono equivalenti (fg) se esiste un intorno aperto U di x sul quale le a 
zioni f|U e g|U di f e Se Si definisce poi il germe di f in x co 
d’equivalenza di f. N 

È i: na un ARA *X di Xx sè naturale definire il germe 
di f in x come la funzione n. s. *f|w.(x). Definiti in tal modo, i germi PR 
funzioni nel senso classico del termine, cioè di dominio ben determinato. 

facile verificare che esiste una biiezione tra gli insiemi di germi standard e n. s. 


Ciò ha permesso, per esempio a Robinson [19694], di dare una dimostrazio- 
ne n. s. molto economica del teorema della teoria dei germi di funzioni ana- 
litiche che generalizza il NulIstellensatz di Hilbert (cfr. p. 480). . 

Una forma del NulIstellensatz afferma che per K corpo algebricamente 
chiuso, se Vy è la varietà di K” definita da un ideale 3= (f1, --.:Îp) dell anello 
di polinomi K[x,,..., x,] e se Vy è la varietà di K definita dal polinomio 
veK[x,..., %n i di varietà VyCV implica che una potenza in- 

* di artenga a Ò. no n. 
i: Ri; l'anello 8 dei germi all’origine delle funzioni analitiche 
FCC. Se q è un germe di $ (o una famiglia o un ideale) si definisce la sua 
varietà V, come il germe all’origine dell'insieme f na F(0)) in cui f è un rappre: 
sentante qualunque di « (che, come si è detto, è una classe di equivalenza). 

Il teorema che Robinson ri-dimostra è il seguente: 


TEOREMA (Nullstellensatz di Riickert). Siano ©, ..., ®p $ dei germi di xa 
Sta 3 l’ideale di $ generato da ©; per i= 1, ..., p. L'inclusione di varietà VyCV,, 
implica che una potenza intera YF di V appartenga a 3. 


Nella formulazione n. s. i germi @; e y divengono sera n. s. sulla 
di C* e le varietà Vz e Vy dei sottoinsiemi di p(0). l l 
re mostra allora che l possibile rimodellare la dimostrazione di 
questo teorema [cfr. Robinson 19695, pp. 140 sg.] su quella classica del a 
stellensatz, che è la seguente. Si supponga che 3 escluda tutte le potenze di ha 
Esiste un ideale F, 323 massimale rispetto a questa proprietà. Si mostra che 
5 è un ideale primo. Sia K' l'anello di integrità quoziente di K[wy, sha %n] ri- 
spetto a J. Poiché K' è d’integrità, ammette un corpo di frazioni K che è ar 
estensione di K. Il punto essenziale è che l’immagine (&,, Dr) È,) nel corpo 
di (x, ..., X,) è un punto generico di 3, nel senso che per ogni fe Ki stai 
fe} equivale a f(&,, ..., &,)=0. In particolare FE 6 ica Pa 
Ma W(E,, ..., în) #0. L'inclusione V3 CV, non è dunque valida in È”. si 
a fortiori non valida nella chiusura algebrica di K. La M-completezza ella 
teoria dei corpi algebricamente chiusi implica che essa non è valida in K. 
Per dimostrare nello stesso modo il Nu/Istellensatz di Riickert, occorre inter- 
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pretare la nozione di punto generico nel caso dei germi generici di funzioni 
analitiche. Si ha allora il teorema seguente: 


TEOREMA (Robinson). Sia 3 un ideale primo di &. Esiste un punto (E, ..., E,) 


della monade u(0) di C" tale che per ogni germe peS, peF equivale a g(&,, 
Ep)=0. 


«res 


3-7. La relativizzazione dell'opposizione finito linfinito. 


Già più volte si è detto che uno dei principali interessi dell’analisi n, s. è 
stato quello di «riportare» l’infinito al finito. Si daranno ora alcuni esempi di 
questa « dialettica» cosi chiaramente anticipata da Leibniz. Tutto ciò è di no- 
tevole importanza epistemologica. Molti dei profondi risultati dell’analisi mo- 
derna consistono nel generalizzare al caso infinito un certo numero di proprietà 
classiche del caso finito. L'analisi n. s. mostra che in generale esistono casi 
*-finiti che sono «eccellenti approssimazioni» dei casi infiniti: perciò, come 
diceva Leibniz, «le regole del finito funzionano nell'infinito» e ciò in linea di 
prificipio. Lo schema generale di tali chiarimenti concettuali dei casi infiniti è 
del tipo schematizzato nella figura ro. Si delineano alcuni esempi. 


Misura dei numeri reali. Se X è un insieme finito, la misura di un sotto- 
insieme A di X è evidente: è sufficiente dividere il numero di elementi di A 
per il numero di elementi di X. Quando X è infinito, come R, il problema è 
molto più delicato. Esso conduce alla teoria della misura. Ora se si considera 
la misura classica dx su R (misura di Lebesgue), ci si scontra con un certo nu- 
mero di «paradossi» semantici (e non logici). Per esempio la misura dell’in- 
sieme Q dei razionali è nulla benché Q sia denso in R. A fortiori la probabilità 
di trovare un numero reale dato scegliendo un numero reale a caso è nulla lad- 
dove spontaneamente (semanticamente) si è portati a pensarla non come nulla 
ma come infinitesimale. 

Appare dunque naturale domandarsi se non sia possibile costruire una mi- 
sura n. s. y su R tale che 1) la misura di un numero sia un infinitesimo fissato; 
2) la misura di un sottoinsieme di R si ottenga — come nel caso finito — somman- 
do le misure dei suoi elementi; 3) la parte standard di v sia la misura dx. 


Analisi s. 
Td 


i —_ 
Riportare 


l'infinito 
Analisi al finito Approssimazione 
n. s. (parte standard) 


Finito Infinito 


* - finito 
Figura 10. ° 


Le regole del finito funzionano nell’infinito. 
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Tale questione è stata risolta da Bernstein e Wattenberg [1969]. Qui ci si 
limita a ricordare che in un allargamento ogni insieme infinito ammette una 
estensione *-finita. L’idea è quella di considerare, in un allargamento *R di R, 
una estensione *-finita R di R e di definire la misura v come nel caso finito. 
Perché la parte standard di v sia la misura di Lebesgue, s'imporrà a R una 
condizione di ripartizione uniforme. 


Teoria di Fourier. Sia T'il cerchio dei numeri reali modulo zx. Una funzio- 
ne f : T+C è una funzione reale a valori complessi periodica di periodo 27. 
Tra queste funzioni ne esistono di privilegiate, le funzioni trigonometriche 
ein: (neZ). La teoria di Fourier (analisi armonica) consiste nell’approssimare 
le funzioni f : T-+C con una sovrapposizione «di armoniche» eine, I passaggi 
sono i seguenti. 

Per neZ si definisce il coefficiente di Fourier f(n) di rango x di f con l’in- 
tegrale 


1 (1 . 
= | {ese da. 


Si ottiene un'applicazione f:Z+C che si chiama trasformata di Fourier di f. 
Si definisce la serie di Fourier f di f come la serie 


fe Sme. 


Si mostra che nello spazio F delle funzioni considerate (in realtà, spazio 
di classi di equivalenza di funzioni uguali «quasi ovunque»), il numero 


i ft 


è un prodotto scalare per cui il sistema delle «armoniche » 4, = eî® è un sistema 
ortonormato completo. Ciò significa: 


pur 
. I A 
1) per ogni neZ, A, ha norma 1: An n= | emme dy=1; 
27 
n 


+ 
; I : ; 
2) per n#m, le 4, sono ortogonali: n, fim) = — Î ente dx =0; 
2 Ja 


3) ogni funzione feF è una combinazione lineare Y aper? (ape C): f>f. 
nEZ 

Ciò significa che F è l’analogo in dimensione infinita di uno spazio « eucli- 
deo» (o come si dice, con più precisione, « hermitiano») C* di dimensione 
finita in cui le 4, costituiscono un sistema di assi «cartesiani». I coefficienti di 
Fourier f(n) sono molto semplicemente le coordinate di f rispetto a tale sistema 
di riferimento, cioè le « proiezioni ortogonali » di f sui vettori unitari 4,: (f(n)= 
=<f, h,)) e la serie di Fourier fè l'analogo della scomposizione classica di un 
vettore in un dato riferimento. f= f: se fsi ottiene a partire da f, reciprocamen- 
te f si riottiene a partire da Î (formula di inversione). 
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Sullo spazio $ delle funzioni f:Z-+C si definisce an 
i zioni f : Z+ che un prodotto scal 
con ‘fi O=L{ME(n). Si dimostra allora la formula di Pig, He È 


ferma che i prodotti scalari <f, i dei ; « 

È È <f; £> sono gli analoghi d i 

dimensione finita: f, g) = <f £> =Y FÉ (1), dp 
NEZ 


Questi risultati classici non sono banali, ma lo diventano nel caso finito. Per 
DEN, si consideri lo spazio 


= Z/pZ si i . dal 
Sia Z Pinsieme degli interi modulo d Si traduce allora nel modo se 


«et Gue T, 
neZ > keZ, 
eine = h, (x) di ein h (225) 
d 
(f: TC) > (f: T,>C) 


fn) > fA)= 5L F (F) e-(2in/p) BI 


fa) -s(7) > f(k)esini hi 


181 .(2rl\ _/27rl 
Ù dt OSE )e(E ) 
LO GOZZI 


” 2° Luxemburg [1972] è allora possibile ritrovare la teoria standard 
s sa pei con un caso *-finito la cui teoria deriva direttamen- 
CUS 
: to di sa intero n. s. infinito) 
è al contrario una «ottima» approssimazione di 7. Infatti se © è «abbastanza 
grande » — cioè se ogni intero standard divide © — *T,, ammette 7 come parte 
standard. Sia fe F, e si indichi con *f,, la restrizione di *fa*T., Se si bla 


rat Ta la teoria finita e se si prendono le parti standard, si ritrova la teoria 


i gev aa Sia E uno spazio vettoriale di dimensione n, per esempio 
u ©, e sia £ un operatore lineare su E, cioè un’applicazione lineare T : E+ E. 
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Se (e, ..., e») è una base di E (cioè un sistema massimale di vettori linear- 
mente indipendenti) e se T(e;) è di coordinate ti relativamente a tal base, la 
matrice nxn (#)= Ap caratterizza T. Se infatti xe T è di coordinate (x), 

n n n n 
x=) xe; T(x)=) a“T(e;) poiché T è lineare, T(x) =Yai} tle;: T(x) è di 

el ini 71 331 
coordinate T(x) =) xét. 

L’analisi spettrale classica di 7 (0 di 47) consiste nell’esprimere 7 come una 
somma di operatori lineari di omotetia definiti su sottospazi di E. Più precisa- 
mente, si cercano i vettori xe E tali che esiste un X€C che soddisfa l’espres- 
sione T(x)=2x (il trasformato di x per 7 è omotetico di x). Se accade questo 
si dice che X è un valore proprio o autovalore di 7° e che x è un vettore 
proprio o autovettore di T. Dire che X è un valore proprio significa che il nu- 
cleo dell'operatore (T—-/) (dove I è l’operatore identico su £) non è ridotto 
a (0) o ancora che TX non è invertibile (cioè non è un automorfismo lineare 
di E). Per ciò è necessario e sufficiente che il determinante D(2) della matrice, 
nxn, Ap-M (dove I è la matrice unità) sia nullo. 

D(2)=0, equazione di grado n in X a coefficienti complessi, è detta equa- 
zione caratteristica di T. Poiché C è algebricamente chiuso, essa ammette n 
radici A,, ...,À, distinte o coincidenti. Nel caso generico le X; sono distinte: 
a ogni A; corrisponde allora, salvo omotetie, un solo vettore proprio: esiste una 
«retta» E; di E sulla quale 7 si riduce all’omotetia X;. Se 7;= 7|E;, allora T 
è la «somma» dei 7. 

Nel caso in cui essa ammetta radici coincidenti (caso non generico) si mo- 
stra (teorema di Jordan) che la decomposizione spettrale di T ha ancora un 
senso. Si chiama spettro di 7 l’insieme delle X,. 

Osservazione: Si suppongano le X; distinte e si prenda per base di E la base 
- dipendente da 7 — composta di vettori propri , corrispondenti ai valori pro- 
pri X;. Con questa base, la matrice Ay di 7° diventa diagonale: 

da, 0 
Ap=| |. 
o da 

L'analisi spettrale è dunque la ricerca di una base (vettori propri) «adattata» 
a T nella quale Ay diventi la più semplice possibile. 

Lo sviluppo dell’accoppiamento fra algebra e analisi, ma soprattutto quello 
della meccanica quantistica, conduce a generalizzare l’analisi spettrale a opera- 
tori definiti su spazi vettoriali di dimensione infinita (numerabile). Tra questi 
spazi si sono privilegiati quelli che generalizzano la struttura dei C* (cioè che 
soddisfano le proprietà elencate sopra alle pp. 512-13): sono i cosiddetti spazi 
di Hilbert. Sono spazi H di dimensione infinita su C, dotati di un prodotto 
scalare <f, g) (e dunque di una norma |f|=<{f} e di una metrica 
d(f,g)=|f-g]) topologicamente completi rispetto alla metrica e che pos- 
siedono una base completa di vettori unitari ortogonali (cfr. del resto l’articolo 
«Calcolo» nel vol. II, pp. 444-45, di questa stessa Enciclopedia). Essi sono stati 
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introdotti da Hilbert per risolvere (tra l’altro) un problema di esistenza di mi- 

nimo che era stato utilizzato implicitamente e senza dimostrazione da Riemann: 

dati uno spazio metrico E di dimensione infinita, un elemento f di £ e un sot- 

tospazio lineare F di E, esiste un elemento g di F la cui distanza da f sia mi- 

nima, o ancora la distanza d di f da F, d=mind(f,g) è raggiunta effettiva- 
e 


mente da un elemento g di F? Se E è uno spazio di Hilbert l’esistenza di £ 
è immediata: è sufficiente prendere per g il «piede della perpendicolare » abbas- 
sata da f su F (teorema della proiezione ortogonale). 

Si è dunque giunti a estendere l’analisi spettrale dalla dimensione finita 
agli operatori in spazi di Hilbert. Appaiono a questo punto parecchie com- 
plicazioni. Per esempio: 


a) I sottospazi lineari di H non sono necessariamente chiusi e un operatore 
lineare non è necessariamente continuo. 

b) Occorre distinguere tra i valori propri A di 7 tali che esiste un xe 77 che 
soddisfa T(x)=2x e gli elementi dello spettro di 7, insieme dei % tali 
che T-M non è invertibile. Che T7—X/ non sia invertibile infatti non 
implica più necessariamente che il nucleo di T--X/ contenga un vettore 
non nullo. , 

c) Lo spettro di T può possedere parti continue. 


Seguendo Robinson [1966, cap. VII] si indicherà come la relativizzazione 
dell opposizione finito/infinito in analisi n. s. permette di. «riportare al finito» 
l’analisi spettrale di operatori lineari «non troppo patologici», cioè compatti e 
autoaggiunti. Si consideri, preliminarmente, un allargamento *77 di H. Sia T 
un operatore lineare. Si considerino i numeri N (eventualmente infiniti in sen- 
so standard) che soddisfano |T(x)|<N|x| per ogni xe H. L’estremo inferiore 
degli N si chiama norma di 7, indicata con ||T|. Essa può essere infinita (in 
senso standard). 


DEFINIZIONE. St dice che T è limitato se ||T| è finita. 
Se 7 è limitato, 7 è continuo. 


OI T è limitato se e solo se *7° trasforma ogni punto finito di 
Pedira 3 so sei : IA y ; 
i. punto finito, cioè se l'insieme *H; dei punti finiti di *H è stabile 


Dimostrazione (Robinson): Se 7° è limitato, allora I*T@I<IT] ||x{| è vali 
do per ogni x di *H. Se ||x| è finita, ||*7(x)[ è finita. Lai a che 
H; sia stabile per *7 e che 7 non sia limitato. Esiste una successione (x,) 
di punti di H di norma finita (per esempio 1) tale che la successione (Tx va 
non è limitata. Come si è visto a p. 498, esiste un intero n. s. infinito we “N. 
tale che ||*T(x,)] sia infinita: *7(x.)é *H;. Ora siccome ||x,l=1, x, € *H e 
dunque *T(xa)e*H;. Contraddizione. 7 è limitato. h sa i 
Sussiste anche la proposizione seguente: 
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PROPOSIZIONE. 7 è limitato se e solo se la monade u.(0) degli infinitesimi 
di *H è *T-stabile. 


DEFINIZIONE. St dice che T è compatto o completamente continuo se, per ogni 
sottoinsieme limitato B di H, T(B) è compatto. 


Si può allora dimostrare quest'altra proposizione: 


PROPOSIZIONE. 7 è compatto se e solo se trasforma i punti finiti di *H in 
punti quasi standard (cioè se trasforma *H, in *Hy3.).. 


coRoLLARIO. Se 7 è compatto, è limitato. 


DEFINIZIONE. Si dice che T è autoaggiunto se, per tutti gli x,ye H, ‘T(x),y)= 
=<x, T(y)). Ciò implica che x, T(x))= <T(x), x) è reale. 


Si consideri dunque un operatore compatto e autoaggiunto T. Per analiz- 
zare T' si considererà essenzialmente un’approssimazione *-finita di H e ad 
essa si restringerà *T; si applicherà poi a tale restrizione l’analisi spettrale clas- 
sica (caso finito) per ritornare infine a 7. I passaggi — nei tratti essenziali — sono 
i seguenti. Sia (e,),en una base ortonormale di H. (e,),e*y è una base ortonor- 
male di *H. Sia we *N., un intero infinito fissato e H,, il sottospazio di *H 
di base (e,, ..., 6,). H,, è di dimensione -finita. È dunque possibile trasfe- 
rirvi la teoria classica. 

Sia P, : *H+H,, il proiettore di *H sul suo sottospazio H., che associa 

(0) 
al punto x=) xe, di *H, il punto x=)' xe, di H,. P., è interno e di nor- 
. ne*N n=l 
ma 1. Sia T,=P,*TP., il trasformato di *7° mediante P.,. |T..|<|T|| poiché 
|P.|=1. 7, è autoaggiunto poiché 7 e P., lo sono. Esso è un operatore inter- 
no su *H. 


PROPOSIZIONE. T,, è compatto (cioè trasforma *H; in *Hys.). 


Poiché 7,, invia H,, in H,,, è possibile considerare la sua restrizione 7” 
a H,. T' è un’approssimazione di 7° definita su uno spazio -finito. Trasferen- 
do al caso n. s. la teoria classica degli operatori autoaggiunti, si può concludere 
che esistono dei valori propri A}, ...,3,, distinti o coincidenti (che si possono 
supporre di valore assoluto crescente) e dei vettori propri %,,...,v, (che si 
possono supporre di norma 1) che soddisfano la <v;, v;) =d;; cioè 


(o, od=|vll=1  1=1,..,0 
Cv; v;)) = 0 se i#j 

Ciò significa che i (v,) costituiscono una base ortonormata di H,, diagonaliz- 
zante T' (questo è possibile per il fatto che 7’ è autoaggiunto, cioè «simme- 
trico »). 

T'v;=0; implica |} <||T'|<||T|| e siccome 7 è compatto e dunque li- 
mitato, i valori propri ); sono finiti. 

Robinson [1966] dimostra allora i due seguenti risultati elementari. 
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PROPOSIZIONE. Se X;éu (dove u è la monade degli infinitesimi di R), il 
vettore proprio v; è quasi standard. 


PROPOSIZIONE. Se X;éu, la dimensione dell’autospazio H; per X; (H; è il 
sottospazio generato dai vettori propri v; corrispondenti a X;) è finita. 


Lo spettro di 7” si scompone dunque in due parti, una parte infinitesimale 
e una parte non-infinitesimale che corrisponde alla situazione classica. Se si 
ordinano i valori propri X; in una successione strettamente crescente (senza ri- 
petizioni) v,, ce Va ($<%) di valori propri distinti e quindi i rispettivi autospazi 
Hi, «.., H$ e i rispettivi proiettori PI, ..., Pi : H.,=H, ..., Hg, si ha per trasfe- 
rimento del teorerna classico di decomposizione spettrale: 


è 
a) H= @Hi 
=1 


limi) 

b I=Y Pj 
I=1 
l=3 

ce) T'=Y yPi 


asi 
Occorre ora «ritornare» da 7’ (definito su /,, approssimazioni di H) a 
T (definito su H). Si i H.La 
ito su H). Sia x=)" xe, un punto di H. La successione (x,),cx si pro- 
P neN 
lunga a una successione (xn)n-*y che definisce un punto *x=S xnén di *H. 
LA î (5) . ne*N 
La proiezione P,,(*x)=) x,6, appartiene a H,, e alla monade u(x) di x. Poi- 
de 


ia x 1 x rod 
ché T,, è « compatto», T'(P.,(*x)) è q. s. Sia °7” la sua parte standard. In tal 
modo si definisce un operatore su H. 


TEOREMA. 0°7"= 7. 


Dimostrazione: Si deve mostrare °(T’P,(*x))=T(x). Ma T'P.(*x)= 
=P,*TP.(*x)eP.(*x)=x. Dunque *TP,(*x)=*7(0)= T(x)eP,*TP,(*x)o 
=P,T(2)=T(2). | voi 
. quindi lecito «ritornare» da 7’ a T prendendo le parti standard. Se À; 
è un valore proprio non infinitesimale, ©, (che esiste poiché A, è finito) è valore 
proprio di T e %v, (che esiste poiché 2; è q. s.) è vettore proprio di T di valore 
proprio %;. Se vi, ..., va sono i valori propri senza ripetizione, se W è l'insieme 
degli indici 1, ..., è che corrispondono ai valori propri non infinitesimali, °H 
la parte standard di #{, H, l’ortogonale in H della somma ® °Hi, e P; (rispet- 

leW 


tivamente P,) il proiettore di H su H, (rispettivamente 07), si ottiene la de- 
composizione spettrale. 


TEOREMA (Robinson). 1) H=H,©°Hj{ 
leW 
leW 
3) T= » °vPi 
leW 
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Si conclude questa riconsiderazione della teoria degli operatori, accennando 
alla risoluzione che Robinson ha dato del problema di Halmos e Smith. 


TEOREMA (Robinson). Sia T un operatore limitato su H tale che un polino- 
mio in T sia compatto. Allora T lascia invariante almeno un sottospazio lineare 
chiuso di H non banale (cioè differente da (0) e da H). 


Tale teorema è un esempio importante di dimostrazione di una congettura 
con metodi n. s. [cfr. Robinson 1966, pp. 195-200]. 


Teoria di Galois. Sia K un corpo e L un'estensione algebrica, separabile 
e normale (cioè di Galois) di K. Ciò significa 1) che tutti gli elementi di L 
sono algebrici su K cioè sono soluzioni di equazioni 2 coefficienti in K, 2) che 
se un polinomio irriducibile (cioè non scomponibile in modo non banale nel 
prodotto di due polinomi) Pe K[x] ha una radice in L, esso si scompone su L 
in prodotto di fattori del primo grado. Se il grado di L su K (cioè la sua di- 
mensione come spazio vettoriale su K) è finito, il teorema centrale della teoria 
di Galois afferma: 


TEOREMA DI GALOIS. Il gruppo G(L/K) degli automorfismi del corpo L, che 
lasciano invariati gli elementi di K, classifica le estensioni intermedie K cFeL: 
c’è una corrispondenza biunivoca tra i sottogruppi normali di G(L/K) e i corpi in- 
termedi F. Ad F si associa il sottogruppo degli elementi Ye G(L/K) che lasciano 
invariati gli elementi di F e a un sottogruppo H di G(L/K) si associa il corpo de- 
gli invarianti comuni a tutti i Ye H. Ad L corrisponde il sottogruppo banale {x} 
e a K l’intero gruppo G(L/K). 


‘Tale teorema non vale più quando il grado di L su K è infinito (e perciò 
in particolare per l'estensione QQ ove O è la chiusura algebrica dei razio- 
nali). Affinché esso valga ancora, occorre limitarsi ai sottogruppi di G= G(L/K) 
chiusi rispetto a una topologia definita intrinsecamente, detta topologia di 
Krull. Questa topologia è definita prendendo come sistema fondamentale di 
intorni dell'elemento neutro 1 l'insieme dei sottogruppi di G di indice finito. 
Poiché la topologia è compatibile con la struttura di gruppo, tale sistema defi- 
nisce, per traslazione, un sistema fondamentale di intorni per ogni elemento 
di G. 

La topologia di Krull può essere ottenuta in modo n. s. trasferendo la teoria 
finita a un’approssimazione *-finita della teoria infinita. 

Si supponga che l’estensione galoisiana KCL sia di grado infinito. La re- 
lazione binaria R(x, 9) dove x e y sono estensioni intermedie «KcacyCL 
e x e y sono finiti e normali» è concorrente. Essa ammette quindi in un allar- 
gamento *K di K una «soluzione globale» *KC®C*L. 

Per costruzione, *FC® per ogni estensione finita normale KCFCL. Sic- 
come UF=L, e FC*F, Lc ®. ® è perciò una estensione *-finita di *K che 
è una estensione di L. Per trasferimento è possibile applicare il teorema di 
Galois a *KC® a condizione di restringersi alle entità interne. 

Sia *G9=G(®/*K) il gruppo di Galois dei *K-automorfismi interni di D. 
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ao ia di *G classificano i sottocorpi interni di ® che 
Sia de *Go. 9 è la restrizione a È di un elemento di *G. Siccome L è unione 

di estensioni normali finite, L= L. Si pone °9=98|L. 09€ G. Si definisce cosf 
un morfismo *Go>G il cui nucleo è l'insieme delle 3e*G, che lasciano L 
invariante. Sia F un'estensione intermedia KCFCL. *F nd è un’estensione 
(interna) intermedia *KC*FN® CD. Sia *Gx il sottogruppo (interno) di *G 
corrispondente a *FN® per il teorema di Galois e sia °Gp= {99} i 
è un sottogruppo normale di G. 

Si definisce cosf un’applicazione y : F+°Gy tra le estensioni intermedie 
Fe i sottogruppi di G. Si tratta ora di caratterizzare l’immagine di 

Sia de *G. Sia 8|L=°9 (questa notazione è compatibile con la VETTA 
precedente). Se SC*G, sia °S={99},.s. Sussiste allora il teorema seguente: 


TEOREMA (Robinson). VU; ©) x . : 
sui ne ci n sottogruppo normale H di G è nell’immagine di Y 


de*Gp * Gp 


Questo teorema, che caratterizza i sottogruppi di G che classificano le esten- 


sioni intermedie KCFCL, permette di ritrovare la topologia di 
quale essi sono chiusi. [J. P.]. da 
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Sviluppatosi nell’ambito del calcolo (cfr. anche numero e modello), con moti 
vazioni provenienti sia dalla matematica «speculativa» (cfr. matematiche) sia d; Ila 
scienza applicata (in particolare dalla fisica), l’infinitesimale si è rivelato come il Sa 
cetto più duttile per trattare matematicamente il moto, ma al tempo stesso LEE 
idea portatrice di contraddizioni (cfr. opposizione/contraddizione e anche dialet. 
tica) a lungo non risolte, Presente con varie modalità in più di un settore della mat ) 
matica (cfr. ad esempio curve e superfici, differenziale, funzioni, variazione e Ha 
che geometria e topologia e invariante), al pari della nozione di infinito cui iatarali 
mente rimanda, ha rappresentato una sfida appassionante per epistemologie e metafisi he 
rivali (cfr. conoscenza, metafisica, filosofia/filosofie). È ssaa 

Apparentemente eliminato col chiarimento dei problemi concettuali inerenti all’op- 
posizione continuo/discreto, l’infinitesimale è riemerso ad esempio nel contesto del 
l'indagine dei linguaggi formali (cfr. formalizzazione), ambito specifico della lo ic 
(cfr. anche deduzione/prova). Nel quadro della teoria dei modelli in particolare vw 
teoria/modello e anche strutture matematiche) si sono potuti esplicitare i Tobieni 
connessi con l’impiego della notazione infinitesimale nel ragionamento Li e di 
conseguenza si è potuto rendere conto delle specifiche proprietà dell’infinitesimale com 
simbolo (cfr. anche codice, segno). L’infinitesimale si è cosi trasformato da an 


( s 
n metodo la cosiddetta analisi non standard di notevo Intere CuI 0 € 
) le nteresse istico ed spo 
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del pianeta Terra. 
un disequilibrio 
0 luogo sotto 
licano però 
“0/squi- 

allora 

sar- 
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Pur avendo origine e sviluppi di tipo matematico, l'opposizione locale /glo- 
bale ha un significato generale (enciclopedico) di carattere concettuale ed epi- 
stemologico. Essa fa parte di quelle grandi opposizioni la cui progressiva chiari- 
‘ficazione assicura alla scienza un valore trascendentale che oltrepassa la padro- 
nanza metodica dei fenomeni empirici. Tuttavia, a differenza di opposizioni clas- 
siche quali forma/sostanza, continuo /discreto, particolare /universale, la sua sto- 
ria è recente: inizia approssimativamente con la metà del xIx secolo. 

Questo articolo si propone d’indicare come, fondata all'origine nell’intuizio- 
ne spaziale, l'opposizione locale/globale abbia invaso il campo matematico (geo- 
metrico e aritmetico) ed abbia condotto all’introduzione di metalinguaggi che 
hanno permesso in questi ultimi anni di riformulare alcuni dei problemi « dia- 
lettici» più critici posti dalla struttura logico-semantico-sintattica delle lingue 
naturali. Tale «intrusione » inattesa ed enigmatica dell’intuizione spaziale nella 
grammaticalità attraverso una serie di passaggi matematici sempre più profondi 
ed unitari solleva senza dubbio più problemi di quanti ne risolva. Rende però 
esplicita una solidarietà fra i diversi livelli del campo simbolico la cui compren- 
sione potrebbe forse trasformare in modo notevole la nostra concezione dei rap- 
porti fra matematica, lingua e realtà. 

Ciò premesso, gli aspetti matematici dell’opposizione locale /globale sono di 
una tale varietà che il presente articolo potrà solo indicarli, senza sperare di es- 
sere esaustivo: bisognerebbe infatti presentare un panorama pressoché completo 
di interi «continenti » della matematica quali la geometria differenziale, la topo- 
logia differenziale, la topologia algebrica, la teoria delle equazioni differenziali o 
la teoria delle singolarità. Se infatti l'opposizione locale /globale riguarda l’ana- 
lisi dei molteplici rapporti dialettici che legano aspetti locali ad aspetti globali, 
essa si riferisce anche all’analisi delle strutture locali e di quelle globali in quan- 
to tali. Il panorama qui presentato sarà quindi selettivo, ma il suo scopo sarà 
raggiunto se mostrerà al lettore come la chiarificazione matematica di una pro- 
blematica tecnica ed endogena presenti una portata paradigmatica che fornisce 
degli &v&Xoya per molti problemi finora rimasti imprigionati nel cerchio della 
speculazione filosofica. 


1. Alcuni aspetti epistemologici dell'opposizione locale /globale. 


1.1. Il problema dell’Enciclopedia. 


Si consideri l’organizzazione lessico-semantica di un’opera interdisciplinare 
come questa Enciclopedia. Gli «articoli ) sono raggruppati in «pacchetti » relati- 
vamente omogenei che individuano problematiche dai contorni abbastanza ben 
definiti. Ad esempio l’articolo « Locale/globale » è correlato da un punto di vi- 
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sta matematico ai seguenti argomenti, ognuno dei quali avrebbe potuto costituire 
un articolo indipendente: incollamento di modelli locali in oggetti globali, pas- 
saggio dal locale al globale ed analisi delle sue ostruzioni, metodi di analisi delle 
strutture locali e/o globali non banali, ecc. c 

Tali temi indicano problematiche «locali » governate sia da campi semantici 
locali (cioè da sistemi di concetti e di opposizioni concettuali specifiche) sia da 
tecniche regionali, teoriche e pratiche, specifiche ed adeguate. ; 

Tali campi locali non sono indipendenti: essi parzialmente si ricoprono, sl 
«incollano » per generare campi di estensione più vasta. L'opposizione locale I 
globale, ad esempio, ricopre in parte le opposizioni centrato /acentrato, conti- 
nuo/discreto, universale particolare, spazio [funzione, alcune delle quali hanno 
dato luogo ad altri articoli di questa stessa Enciclopedia. Si pone quindi imme- 
diatamente il problema d’individuare il tipo di struttura globale offerto in defi- 
nitiva dall’Enciclopedia in quanto oggetto testuale che vuole riflettere parzial- 
mente l’organizzazione del nostro sapere. È ben noto come questo problema sia 
la croce del comitato di redazione. È però facile convincersi che procede dal 
fatto che lo «spazio » globale di una Enciclopedia non è rappresentabile. Rappre- 
sentabili sono solo i campi locali poiché, isotopi in senso semantico, essi dipen- 
dono da un codice. In conclusione il problema posto dall Enciclopedia, e quindi 
dal sapere stesso, consiste nel fatto che non vi è una rappresentazione codifica- 
bile del suo «spazio» globale. L’Enciclopedia non è un dizionario. 


1.2. L'opposizione locale/globale come problema semantico-lessicale. 


Per precisare tale questione, si elimini il problema del sapere e ci si limiti 
alla struttura semantica di un lessico. Si incontrano due difficoltà tradizionali: 


a) la non-esistenza di termini primitivi (circolarità delle definizioni in un di- 
zionario); DE 

b) la non-esistenza di sensi propri (irriducibilità dei tropi, degli effetti di me- 
tafora e di metonimia). 


Queste due ostruzioni all’univocità globale del lessico evidenziano il fatto 
(fondamentale) che lo «spazio » globale del lessico non può essere ottenuto per 
semplice estensione della struttura dei campi locali. Solo localmente un lessico 
può essere univocamente ricostruibile a partire da componenti primitive. Si pos- 
sono certo costruire, per allargamenti successivi, dei campi « più » globali dei cam- 
pi locali iniziali (l’opposizione locale /globale è essenzialmente relativa) ma nes- 
suno di essi è identificabile con lo «spazio » globale del lessico. Non appena rag- 
giunge un certo grado di complessità, un lessico non è mai «triviale », non pos- 
siede più la struttura di un campo locale. Per fortuna, poiché la ricchezza delle 
lingue naturali è dovuta al fatto che il loro lessico non è globalmente triviale. 

La ricerca classica della determinazione del senso proprio, dettata dalla preoc- 
cupazione, apparentemente lodevole, di rendere globalmente univoca la lingua, 
diventa in questo contesto una volontà di trivializzazione. Essa corrisponde al- 
l’idea che dovrebbe esistere uno spazio semantico «di base» globale ma avente 
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la struttura di campo locale e tale che ogni «senso figurato » possa prolungarsi 
in un campo locale situato «al di sopra» di esso. Invece l’irriducibilità dei tropi 
e la non-esistenza di termini primitivi significano proprio che un tale spazio 
di base esiste solo localmente. Ammettendo che lo «spazio» globale del lessico 
sia munito di una naturale relazione di prossimità semantica tra lemmi lessi- 
cali (cioè di una sorta di «topologia» canonica) i tropi stabiliscono delle identi- 
ficazioni «a lungo raggio d’azione » — translocali — tra i campi locali e «lo spazio 
di base», giacché vi è sempre un momento in cui, per estensione, un senso 
«figurato » associato a un campo di base diventa un senso « proprio » per un cam- 
po diverso. Si può dunque dire che i tropi costituiscono la rappresentazione 
nell’ambito del codice stesso di uno stock aperto di operatori virtuali di incolla- 
mento tra campi locali. Il passaggio dal virtuale all’attuale di tali operatori di- 
pende da una scelta. Ne consegue che non soltanto lo «spazio » globale del lessico 
non ha la struttura di un campo locale ma che esso non esiste neanche in quanto 
tale. Non esiste uno «stato» globale di base del lessico: i soli stati globali sono 
gli stati «eccitati» definiti da una scelta opportuna degli operatori di incolla- 
mento e sono quindi l’espressione di un soggetto produttivo dell’enunciazione. 
Passando cosi attraverso il problema logico-semantico, l'opposizione locale/glo- 
bale viene ad intrecciarsi con l'opposizione oggettivo/soggettivo: un lessico è 
«oggettivo» (cioè intersoggettivo, codificabile) solo localmente. 


All’impossibilità di rappresentare la struttura globale del lessico si aggiunge 
un’altra difficoltà, relativa alla struttura locale dei campi semantici: i campi se- 
mantici locali non sono continui, bensi sono dati in forma discreta. Per affron- 
tare questo problema si userà la mediazione della percezione, e cioè si avrà 
a che fare con la questione della cosiddetta percezione categoriale. Si tratta di 
capire in che modo gli spazi di stimoli fisici variabili con continuità (fonemi, 
timbri musicali, ecc.) sono discretizzati dalla percezione. A tal fine gli stimoli 
vengono rappresentati, usando tecniche raffinate, in uno «spazio » di descrizione 
avente dimensione in generale assai limitata (mentre come entità fisiche tali sti- 
moli appartengono in generale a spazi funzionali di dimensione infinita); tali 
spazi di descrizione sono muniti di una «topologia » esprimente la relazione per- 
cettiva di prossimità fra gli stimoli. In tali spazi gli stimoli si raggruppano in 
zone, gli stimoli di una stessa zona essendo ricevuti in modo equivalente. Le zone 
sono separate da « frontiere », distribuite mediante un sistema di soglie, vale a di- 
re mediante una morfologia discriminante che pare essere determinata genetica- 
mente. Durante una deformazione continua di uno stimolo, l’attraversamento di 
tale morfologia è accompagnato da una transizione «catastrofica » del riconosci- 
mento percettivo. Parlare in questo contesto di « discretizzazione » significa solo 
affermare che lo «spazio » di descrizione considerato è uno «spazio » di difteren- 
ziazione, differenziato dalla sua morfologia discriminante. A questo punto l’op- 
posizione locale/globale s’intreccia con le opposizioni continuo /discreto e iden- 
tità/differenza (cfr. tali articoli dell’ Enciclopedia). 

Il problema teorico posto da tali «spazi di differenziazione » ha importanza 
capitale. Poiché gli stimoli possono variare in modo continuo, in uno spazio detto 
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spazio substrato, la loro discretizzazione può provenire solo dalla struttura del 
recettore: si tratta quindi di «risalire» dalla morfologia osservabile di differen- 
ziazione alla dinamica non osservabile del recettore, concepito come una «sca- 
tola nera». Tale problema, che è in generale quello dello strutturalismo, ha ri- 
cevuto un inizio di risposta con la teoria delle catastrofi di René Thom (cfr. 
l'articolo « Catastrofi» in questa stessa Enciclopedia). 

Ritornando alla struttura locale dei campi semantici, si osservi che la loro de- 
scrizione in termini di sistemi di scarti differenziali, di tratti distintivi o di oppo- 
sizioni semiche culturalmente determinate, ne fa degli «spazi di differenziazione » 
senza substrato. Il «nonsenso » rappresentato da quest'idea di morfologie discri- 
minanti sospese nel vuoto come il sorriso del gatto in Alice in Wonderland, costi- 
tuisce, a parere di chi scrive, la seconda croce della semantica teorica (la prima, 
come si è visto, è quella del passaggio dal locale al globale). Sembra che essa 
possa venire eliminata soltanto in due modi, fra loro antagonisti, che coinvol- 
gono l’insieme della teoria: facendo appello a formalismi intrinsecamente di- 
screti di tipo logico-combinatorio (ed allora vietandosi ogni concezione non ba- 
nale della semantica), oppure estendendo alla semantica il paradigma catastro- 
fista [Petitot 1977] ed allora scontrandosi con la non-esistenza di metodi empi- 
rici adeguati a definire i continui che servono di spazio substrato ai campi se- 
mantici locali. 


Ritornando al problema dell’Enciclopedia come oggetto globale, esso è stato 
assai ben formulato da Umberto Eco nell’ambito della semantica strutturale. 
Nella sua critica alla concezione logicista e dogmatica di Katz e Fodor, Eco 
osserva che essa «rappresenta la competenza ideale di un parlante ideale: in ef- 
fetti esso tende a formulare un dizionario elementare che non può spiegare la 
competenza socializzata nella vivacità delle sue contraddizioni » [1975, p- 143]. 
Contrapponendo « dizionario astratto » (suscettibile localmente di una descrizio- 
ne univoca in sistemi di componenti) ed «enciclopedia concreta » (rappresentan- 
te un soggetto), Eco osserva che nessun reticolo di semi può rappresentare la 
struttura globale della semiosi nella sua apertura illimitata. « Nessun grafo è 
in grado di rappresentarla nella sua complessità. Esso dovrebbe apparire come 
una sorta di rete polidimensionale, dotata di proprietà topologiche, dove i per- 
corsi si accorciano e si allungano e ogni termine acquista vicinanze con altri, at- 
traverso scorciatoie e contatti immediati, rimanendo nel contempo legato a tutti 
gli altri secondo relazioni sempre mutevoli» [ibid., p. 176]. Si ritrova qui l’idea 
che un universo semantico è solo localmente codificabile e che i suoi stati glo- 
bali sono stati «eccitati» (e cioè senza stato di base), dinamici e fluttuanti, espri- 
menti un soggetto dell’enunciazione e le sue idiosincrasie. « Il codice non è una 
condizione naturale dell'Universo Semantico Globale né una struttura soggta- 
cente, in modo stabile, al complesso di legami e diramazioni che costituisce il 
funzionamento di ogni associazione segnica» [ibid., p. 179]. : 

Il linguaggio è lo strumento naturale dei soggetti giacché ogni lemma lessica- 
le raggruppa ed anticipa un insieme aperto di « incollamenti » semantici, e giac- 
ché non esiste alcun incollamento canonico dei codici locali. Il soggetto è sempre 
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particolare poiché esso incarna il luogo in cui il semiotico «si distacca» dalla sua 
codifica locale per « passare al globale » attraverso identificazioni translocali idio- 
sincrasiche. Si è in tal modo direttamente condotti dalla semiotica alla psicanalisi. 

La psicanalisi infatti, almeno quella lacaniana, è fondata sull’ipotesi che tutti 
gli stati globali rappresentanti la «regolazione » psichica di un soggetto dell’enun- 
ciazione hanno in comune una sorta di «configurazione critica » che governa gli 
incollaménti semantici che li caratterizzano. La sua sfida è di «ridiscendere », con 
tecniche appropriate, dai discorsi del soggetto a tali «singolarità » organizzatrici 
per «risalire » a partire da esse verso una trasformazione della regolazione (la re- 
golazione si manifesta clinicamente come fantasma e coazione a ripetere). T'ale 
«chirurgia », la cui funzione è un rimaneggiamento della performance esistenziale 
(l’esistenza essendo, come a tutti è sperimentalmente noto, performance pura, 
senza competenza), può basarsi solo su un'istanza paradossale di mediazione 
della semantica «superficiale» degli stati globali con la semantica «profonda» 
(sessuale) evidenziata da Freud. Si tratta dell’istanza del significante lacaniano 
«radicato » nel registro pulsionale. 


1.3. La «rettificazione » filosofica della lingua. 


Le considerazioni precedenti mostrano come la lingua non sia — per ragioni 
strutturali — il supporto naturale della razionalità. Per divenirlo essa deve essere 
«rettificata ». Tale rettificazione, che è alla base del desiderio filosofico positivo, 
punta ad una duplice violenza: a) rendere globalmente univoca la lingua; è) im- 
porre alla lingua l’idea di realtà oggettiva come livello di base. Ciò implica anzi- 
tutto lo sradicamento del soggetto il cui idioletto inconscio organizza gli stati glo- 
bali eccitati, particolari ed idiosincrasici, del sapere. Ciò implica poi, per una lin- 
gua ormai diretta verso l’obiettività come referente necessario ed ideale, la ridu- 
zione di ogni stato globale alla struttura di un campo locale. T'ale riduzione si 
realizza attraverso un processo gerarchico di astrazione, il quale, nella misura in 
cui l’oggettività diviene in esso costituita e costituente, culmina nell’introduzio- 
ne delle categorie (cfr. l'articolo «Categorie/categorizzazione » in questa stessa 
Enciclopedia). 

Inoltre, la riduzione di un globale particolare a un locale categorico è insepa- 
rabile da altre due « rettificazioni »: 


a) la rettificazione dello spazio-tempo per riduzione di uno spazio-tempo ar- 
caico «fluttuante » ottenuto per incollamenti simbolici (per esempio tote- 
mici) di territori locali ad uno spazio-tempo geometrico ed universale ot- 
tenuto per estensione diretta della sua struttura locale (cfr. $ 2.1); 

b) la rettificazione della grammatica in logica. 


Ciò premesso non si deve credere purtroppo che tale riduzione razionale al 
locale possa essere completa. Anzitutto essa trascura un resto inerente al proble- 
ma della regolazione, in particolare della regolazione biologica. Tale difficoltà è 
stata vista con molto acume da Kant — il quale, non è il caso di dirlo, è uno dei 
«fari» della riduzione al locale — nella sua terza critica, la critica del giudizio. 
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Inoltre può essa stessa, in un secondo momento, divenire la molla per una prolife- 
razione dialettica che ne rigenera l'origine globale. In questo senso la dialettica he- 
geliana può, ad esempio, essere interpretata come una restaurazione del globale 
dopo la riduzione kantiana al locale. Lo «spazio » del Concetto è uno spazio glo- 
bale; per ciò stesso è non-rappresentabile, a meno di trasformare l'Assoluto in 
Soggetto; ammette solo stati globali «eccitati» la cui storia s’identifica con la 
Storia. In questo contesto la critica marxista dell’idealismo hegeliano consiste- 
rebbe in una nuova riduzione al locale, non più categorica e trascendentale co- 
me in Kant, ma infrastrutturale ed immanente. 


1.4. L’imperialismo del locale nelle scienze. 


Nell’affrontare l’universo scientifico si ritrova ovviamente la metafora « geo- 
grafica » delle «regioni » disciplinari (qui in posizione di campi locali); tuttavia la 
dialettica locale/globale vi subisce una vera mutazione. 

Due sono le novità radicali che appaiono infatti con il metodo scientifico (che, 
giova ricordare, non si riduce al metodo sperimentale). Anzitutto la riduzione del 
globale non già al locale categorico od infrastrutturale ma al locale tipico di fe- 
nomeni elementari matematizzabili: perché il termine ‘locale’ ha un duplice si- 
gnificato: 1) localizzazione nell’universo dei fenomeni (e cioè scelta metodologi- 
ca dei fenomeni elementari), e 2) localizzazione spazio-temporale. Questa ridu- 
zione è una conditio sine qua non per la comprensione. Come è stato più volte 
osservato, le grandi teorie scientifiche (gravitazione, elettromagnetismo, ecc.) 
sono teorie a priori non locali che si è stati in grado di rendere locali. In secondo 
luogo la convinzione che il passaggio al globale (e cioè all’universo dei feno- 
meni) possa effettuarsi per estensione progressiva di un locale tipico assunto 
come livello di base universale. Tale «imperialismo» di un locale particolare 
(quello della fisica classica) che si pretende universale è appoggiato da quella 
ideologia scientifica di base che è il riduzionismo. È evidente che qui «ideologia » 
non significa opinione. L’imperialismo del locale domina le scienze poiché l’uni- 
versalità della fisica classica è veramente effettiva ed è la sola suscettibile di assi- 
curare la padronanza dei fenomeni. 

A tale imperialismo se ne aggiunge ora un altro, critico per più motivi, quello 
dell'informatica. Si può dire che questo nuovo imperialismo — che segue quello 
realizzato dalla matematica nella sua storica alleanza con la fisica classica — si basa 
sulla trasformazione del linguaggio in tecnologia e cioè sulla possibilità di far ri- 
passare al globale, per imperialismo del locale, la riduzione logico-sintattica al lo- 
cale del linguaggio. 

Con l’estensione delle tecnologie fisiche ed informatiche la concezione clas- 
sica dell’universalità scientifica (quella espressa dal programma di Laplace, per 
intendersi) viene ad avere un’universalità concreta, politico-economica. La big 
science mondiale, conseguenza dell’appropriazione da parte dell’industria ameri- 
cana del «genio » europeo, possiede ormai la capacità di controllare contempora- 
neamente sia la padronanza dei fenomeni sia il controllo sociale. Essa assume cosî 
il carattere di una scienza senza esterno che sottomette al potere generalizzato del 
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Capitale quanto, per le nostre culture, rappresenta la verità. Le conseguenze so- 
cioculturali ne sono incalcolabili. . 

Il «malessere » caratteristico delle società «unidimensionali » moderne è in 
gran parte dovuto al fatto che tutte le discipline hanno cercato, per sete di potere, 
di ripetere per proprio conto il processo storico con il quale la fisica è divenuta una 
scienza senza esterno. Esso è dovuto alla volontà sistematica di subordinare il glo- 
bale a un imperialismo del locale privilegiante l’azione. Il vantaggio di un tale 
volontarismo è evidente: esso permette infatti una «internalizzazione », caratteri- 
stica per ogni disciplina, dei criteri di verità e con ciò stesso una proliferazione di 
competenze basata sull’idea di una qualche armonia prestabilita tra la suddivisione 
isonomica dell’essere e la divisione sociale del lavoro. Ma siccome la verità non 
ha alcun motivo per godere di tale armonia e siccome il «miracolo » della fisica 
è soltanto un miracolo regionale, l’insieme di tali strategie si dissolve in una 
parcellizzazione dei singoli poteri malgrado il gioco dell’interdisciplinarità ed 
il nuovo tipo di riduzione categorica al locale che vorrebbe essere realizzato da 
teorie universali quali, ad esempio, la teoria dei sistemi. 

Per comprendere tale situazione, le critiche esterne della scienza non sono 
di alcuna utilità. Ciò di cui è drammaticamente carente il pensiero contempo- 
raneo è una reinstaurazione del globale che sia compatibile con la riduzione 
metodologica del globale al locale tipico. 


1.5. La matematica moderna come reinstaurazione del globale. 


Una rinnovata instaurazione del globale in un campo incessantemente do- 
minato da un imperialismo del locale può apparire a prima vista un’utopia. Si di- 
menticherebbe però che il valore trascendentale delle scienze proviene dal modo 
con cui la matematica pura vi è implicata (e non applicata). Ecco dunque, per con- 
cludere il paragrafo, alcune considerazioni sullo statuto generale delia matematica 
moderna. 

Una delle caratteristiche più significative della matematica pura consiste nel 
saper costruire esplicitamente il proprio senso. In questo essa si oppone radical- 
mente ad ogni lingua naturale. Ma ciò non significa affatto (malgrado il pregiudizio 
assiomatico) che la sua «essenza » sia di essere una lingua formale ridotta ai propri 
automatismi generativi. Come ha osservato Thom, il generativismo matematico 
non sfocia nell’insignificanza, proprio in quanto è «incollato » in un modo o nel- 
l’altro a un’intuizione e soprattutto all’intuizione del continuo: è solo in quanto 
sbocca nello spazio come «forma simbolica» che l’iterazione automatica delle 
procedure algebriche sfugge allo «scollamento semantico». 

Certamente la metafora geografica si applica all’universo matematico come 
ad ogni universo. In questo universo globale, la riduzione categorica al locale assu- 
me l’aspetto della cosiddetta (senza giochi di parole) teoria delle categorie e la ri- 
duzione logico-sintattica al locale, quello del metodo assiomatico. Queste due ri- 
duzioni sono fondamentali in quanto permettono alla matematica d’internaliz- 
zare in larga parte il problema della sua fondazione. Ma tale fatto non deve far 
perdere di vista che la matematica moderna è, per quanto riguarda la sua creati- 
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vità, dominata da un tipo di passaggio dal locale al globale analogo a quello con- 
siderato a proposito dell’Enciclopedia. 

Infatti, per risolvere i problemi che si è data, la matematica moderna ha do- 
vuto, almeno dopo Gauss e Galois, introdurre una serie di concetti translocali e 
praticare un’intensa attività analogica di parziale traduzione da una teoria all’altra. 
Tale «intertestualità ) generalizzata si è accresciuta al punto che la rete logico- 
semantica della matematica moderna è divenuta assai simile a quella di una lin- 
gua naturale: la complessità globale della lingua matematica attuale si avvicina a 
quella di una lingua naturale, con la differenza assolutamente fondamentale però 
che il senso vi rimane esplicitamente costruito e le analogie dimostrabili. 

Si può dunque dire che non esiste «stato di base » per la matematica: se la ma- 
tematica moderna rimane unitaria ciò non avviene, come in fisica, per un impe- 
rialismo del locale; ma per il fatto che essa non possiede una struttura globale 
canonica, essendo i suoi soli stati globali degli stati «eccitati», ottenuti per ana- 
logie translocali. Le conseguenze di questa situazione sono assai numerose e di- 
verse: eccone alcune positive ed altre negative. 

1) A livello culturale, l'apparente dissoluzione degli oggetti matematici con- 
creti in una intertestualità generalizzata rende le caratteristiche della creatività 
matematica incomprensibili ai non iniziati, cioè «esoteriche ». Tale distacco del- 
la matematica dal contesto culturale è drammatico nella misura in cui la mate- 
matica costituisce ormai il solo luogo in cui sia ancora veramente pensabile una 
reinstaurazione del globale compatibile con la riduzione metodologica del globa- 
le al locale tipico. Orbene, si sono poco sopra sottolineate le conseguenze disa- 
strose della mancata reinstaurazione del globale, non ultima delle quali è l’appro- 
priazione generalizzata da parte del Capitale dell’armamentario scientifico e con 
esso di ciò che, nelle nostre culture, è la verità. 

2) A livello pedagogico, la mancanza di una struttura globale canonica conduce 
a sopravvalutare la riduzione categorica e /o logico-sintattica al locale e cioè le ten- 
denze assiomatiche e logiciste formali. 

3) A livello della sociologia della matematica, l’idea di «grande » matematico 
discende direttamente dal fatto che, al di là della sua garanzia di coerenza, la ma- 
tematica è l’espressione di un soggetto dell’enunciazione. È «grande » matematico 
ogni matematico che, per risolvere un problema locale giudicato cruciale, ha dato 
origine ad uno «stato » eccitato globale e cioè in definitiva a uno stile. 

È d’altronde interessante fare qui un’osservazione a proposito del nome leg- 
gendario di Nicolas Bourbaki. Tale nome ricopre infatti una doppia realtà. Da un 
lato gli Eléments de mathématique sono un capolavoro della riduzione al locale e 
d’altro lato il Séminaire è un’enciclopedia degli stati globali «eccitati » del sapere 
matematico contemporaneo. Per Jean Dieudonné, «quando si studia la storia della 
matematica si constata quasi invariabilmente che una teoria inizia cercando di 
risolvere un problema molto particolare... Una situazione... favorevole è quella in 
cui, approfondendo le tecniche utilizzate per risolvere il problema di partenza, 
si arriva (eventualmente a prezzo di notevoli complicazioni) a usarle in altri pro- 
blemi simili o più difficili, senza tuttavia che si abbia l’impressione di capire vera- 
mente la ragione di tali successi; si può dire che sono i problemi a generare un 
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metodo... In alcuni casi abbastanza rari, lo studio del problema finisce, talvolta 
dopo un lasso di tempo notevolmente lungo, per rivelare l’esistenza di strutture 
soggiacenti insospettate, le quali non solo illuminano il problema posto, ma forni- 
scono strumenti generali e potenti atti ad elucidarne un gran numero di altri in 
diversi ambiti» {1977, p. x]. Dieudonné constata che la maggior parte degli 
argomenti esposti al Séminaire Bourbaki appartengono a quest’ultima categoria. 

4) Ma la grande conseguenza di questa affinità della matematica moderna 
con una lingua naturale potrebbe essere quella di rompere l’alleanza storica della 
matematica con le scienze esatte, lasciando alle tecnologie informatiche tale com- 
pito, al fine di spostare la propria meta verso una rifondazione dei rapporti con la 
realtà. Attualmente, questo nuovo tipo d'impegno ontologico è rappresentato da 
quell’idea fondamentale di Thom secondo cui l’intertestualità matematica infor- 
mata dall’intuizione spaziale ha raggiunto una maturità sufficiente per poter con- 
siderare una geometrizzazione del senso, ed attraverso di essa riprendere su basi 
radicalmente nuove i problemi classici della Caratteristica universale, del rap- 
porto tra categorie di pensiero e categorie linguistiche e inoltre una elucidazione 
dialettica della regolazione biologica e del tempo come principio morfogenico: 
in breve, delle aporie che fino ad ora animavano il cuore speculativo del concetto. 


2. L'opposizione locale/globale e il concetto di spazio. 


Quello che precede mostra l’importanza di sviluppare un'intuizione del pas- 
saggio dal locale al globale. Per ottenere tale scopo l’indagine matematica è essen- 
ziale. Ad essa è dedicato quest'articolo. 


2.1. Dalla rottura euclidea alle geometrie non-euclidee. 


L'opposizione locale/globale è costitutiva della nostra rappresentazione dello 
spazio. È certo che il nostro spazio è localmente euclideo. Il nostro organismo ne 
offre un'eccellente simulazione. Ciò non implica peraltro che lo spazio «sia» glo- 
balmente euclideo. La natura della sua struttura globale sfugge a priori alla si- 
mulazione organica e non può quindi essere che l’oggetto di una rappresenta- 
zione, la cui storia è lungi dall’essere banale. 

Per gli animali, lo spazio è un territorio: anzitutto è l'estensione a domini lo- 
cali delle grandi regolazioni metaboliche quali la predazione; esso è inoltre un 
incollamento di tali domini locali mediante indizi significanti, per esempio «se- 
mantici », di natura sensoriale (per esempio olfattiva). Dunque non esiste una 
vera e propria rappresentazione globale dello spazio : la rappresentazione s’iden- 
tifica ad una memorizzazione del sistema di indizi. 

Si può forse avanzare l’ipotesi che la situazione sia analoga per ciò che con- 
cerne le società «primitive». Come scrive René Thom in un articolo dedicato 
alla magia, articolo dal quale si è d’altronde presa a prestito nel $ 1 l’immagine 
di stato «eccitato » d’uno spazio globale flessibile ed individuale, «si può dire che 
l'atto magico sia caratterizzato in modo essenziale da ‘‘un’azione a distanza’ che 
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può essere interpretata come una modificazione della topologia usuale dello spa- 
zio-tempo. In altri termini: i raccordi tra carte locali che definiscono lo spazio 
usuale non sarebbero fissi, ma potrebbero essere modificati secondo la volontà 
di certi uomini (maghi o stregoni), e ciò in virtù di procedure specifiche (rituali 
magici, sacrifici, ecc.). Inoltre la topologia dello spazio cesserà di essere la stessa 
per tutti, poiché le esperienze percettive di un osservatore possono a loro volta 
essere affette da azione magica » [1978, p. 70]. 

È chiaro che attualmente la nostra rappresentazione spontanea dello spazio è 
in netto contrasto con tale punto di vista. Per noi, lo spazio-tempo, come condi- 
zione di oggettività, è per natura a-soggettivo. Si tratta di uno spazio di base 
immutabile, universale, indipendente da ogni osservatore che non è suscettibile 
di alcuno stato «eccitato ». Inoltre è uno spazio la cui struttura globale non si ot- 
tiene per incollamento di domini locali, ma per estensione diretta della sua strut- 
tura (euclidea) locale. 

Non bisogna sottovalutare il fatto che questa rappresentazione spontanea ha 
per noi valore d’intuizione. Essa fa parte della nostra razionalità e le sue conse- 
guenze sono innumeri. Se ne citano tre particolarmente evidenti. 

1) Dal momento in cui lo spazio-tempo viene concepito come spazio di base 
universale, bisogna poter descrivere i fenomeni a partire da spazi di descrizione 
derivati dalla sua struttura. Questo vincolo epistemologico corrisponde a ciò che 
Husserl chiamava «l’ipotesi galileiana ». 

2) Dal momento in cui la struttura globale dello spazio si ottiene per estensione 
diretta della sua struttura locale, non è più possibile individuare lo spazio se non 
attraverso un riferimento. Ma poiché tutti i riferimenti sono equivalenti (tutti gli 
osservatori essendo interscambiabili), la descrizione dei fenomeni deve nono- 
stante tutto essere intrinseca (indipendente dal riferimento scelto): è l’origine 
del principio di relatività. 

3) Dal momento in cui, divenuta intuizione, questa rappresentazione risulta 
costitutiva per un’obiettività identificata alla verità, la verità stessa si trova sepa- 
rata come dal filo di un rasoio dall'insieme del campo semiotico e simbolico. Tale 
separazione, tipica dell’epoca moderna, è all’origine dell’irriducibile conflitto 
che oppone la scienza alle pratiche simboliche (siano esse la filosofia speculativa, 
la fenomenologia, il materialismo dialettico, la psicanalisi) come alle pratiche si- 
gnificanti (siano esse la poesia, la pittura o la sperimentazione corporale). 

Inquadrato in tale prospettiva, il «miracolo » geometrico greco sa di notevole 
violenza. Niente prova, certo, che la geometria euclidea si sia inizialmente ispi- 
rata alla struttura dello spazio fisico. Sembra piuttosto ch’essa si sia rifatta alla 
formalizzazione dei processi di costruzione geometrica. Ma ciò non impedisce 
ch’essa costituisca uno dei principali centri motori di quella « rettificazione » ge- 
neralizzata del simbolico che, da allora, ha diretto la storia (cfr. $ 1.3). 

Se la struttura globale dello spazio si ottiene per estensione diretta della sua 
struttura euclidea locale (e converrebbe analizzare il ruolo della vista in tale esten- 
sione), dev'essere possibile far entrare in esso la nozione localmente intuitiva di 
rettitudine di una retta. Ciò tuttavia non è automatico. La nozione di rettitudine 
è localmente intuitiva poiché essa può essere « controllata », «regolata » da espe- 
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rienze concrete. Tuttavia non esiste evidentemente alcun « controllo », alcuna «re- 
golazione » di questo tipo a livello globale. Euclide ha compreso a fondo tutto que- 
sto : la nozione di retta è una nozione primitiva la cui proprietà caratteristica di ret- 
titudine dev'essere oggetto di un «giudizio sintetico a priori », cioè d’un assioma 
logicamente irriducibile agli altri assiomi della geometria: si tratta del famoso as- 
sioma delle parallele. In tal senso la geometria non è una scienza a priori come 
lo è la logica. Essa esige una «regolazione » capace di controllare la coerenza del 
passaggio del proprio concetto primitivo dal locale al globale. 

È ben noto che l’assioma di Euclide ha fatto scorrere molto inchiostro. Una 
precisa tradizione, nutrita dal desiderio di fare della geometria una scienza a 
priori, ha tentato di « dimostrarlo », di dedurlo cioè dagli altri assiomi della geo- 
metria. Nel corso dei secoli l'impossibilità di arrivare ad una tale «dimostra- 
zione» sapeva di vero e proprio «scandalo ». Tale scandalo è stato messo defini- 
tivamente a tacere all’inizio del xx secolo allorché Gauss, Bolyai e Lobatevskij 
dimostrarono che gli altri assiomi della geometria euclidea ammettevano un’in- 
terpretazione coerente che violava l’assioma delle parallele. Questa nuova geo- 
metria è la geometria iperbolica, caratterizzata da una serie di fenomeni atipici. 
Essa ha offerto il primo esempio di un fenomeno che è fondamentale per il tema 
di quest'articolo. Localmente, cioè in ogni dominio d’estensione «infinitesima- 
le», la geometria iperbolica diventa euclidea. In altri termini, uno spazio iperbo- 
lico ammette in ogni punto uno spazio euclideo «tangente». Si può dunque di- 
re che la geometria iperbolica concretizza un altro modo di estendere al globale 
la struttura euclidea locale dello spazio, diverso da quello dell'estensione diretta. 


2.2. Le diverse estensioni del concetto di spazio. 


Prima d’indagare in qual modo, nel corso del xIx secolo, l’aspetto operativo 
dell’opposizione locale/globale ha rivoluzionato il concetto stesso di geometria, 
verrà ricordato in quale contesto si è sviluppata tale trasformazione. 

. Fino all’inizio del x1x secolo, la geometria si ridusse essenzialmente allo stu- 
dio di oggetti geometrici (cfr. l'articolo «Curve e superfici » in questa stessa £x- 
ciclopedia) immersi in uno spazio ambiente bi- o tridimensionale. I metodi uti- 
lizzati sono da una parte quelli sintetici ereditati dalla tradizione euclidea e dal- 
l’altra quelli analitici ed algebrici fondati sull’uso di coordinate. Con l’introdu- 
zione del calcolo infinitesimale, le coordinate permettono l’analisi delle proprietà 
differenziali degli oggetti (equazione delle tangenti, delle normali, struttura dei 
punti singolari, ecc.). Ecco apparire i primi teoremi generali sulle curve alge- 
briche e la «solidarietà » che esiste tra la loro struttura locale e quella globale. 
Servano da esempio due famosi risultati di Maclaurin (uno dei grandi succes- 
sori di Newton): una curva piana irriducibile di grado n non può possedere più 
di [(r—1)(n-2)]/2 punti doppi; su una cubica piana dotata di punti di flesso, 
la retta che ne congiunge due passa necessariamente per un terzo. 

Ma l’approfondimento di tali problemi porterà, durante il x1x secolo, ad una 
completa ristrutturazione del concetto di spazio ambiente nel quale gli oggetti 
geometrici si trovano immersi, 
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Intanto, per poter disporre di teoremi generali (in particolare del teorema di 
Bézout secondo cui due curve piane di rispettivi gradi 7 e s s'intersecano esatta- 
mente in rs punti contati con la loro molteplicità), si estende sistematicamente 
la nozione di spazio ambiente agli spazi proiettivi complessi ottenuti aggiun- 
gendo i punti all’infinito e i punti immaginari. Con Poncelet, Steiner, Staudt, 
Pliicker, Cayley, ecc. la geometria proiettiva complessa eserciterà una fortissima 
influenza. Permetterà dapprima di dimostrare tanti risultati sulla struttura gene- 
rale delle curve e delle superfici algebriche e in particolare sulla solidarietà lo- 
cale/globale: configurazione dei nove punti di flesso di una cubica piana, si- 
tuati a tre a tre su dodici rette; configurazione delle ventisette rette della super- 
ficie cubica; ecc. D’altra parte la geometria proiettiva condurrà alla considera- 
zione di «spazi» i cui «punti» non sono punti nel senso geometrico del termine. 
Per esempio lo studio dei complessi di rette dello spazio proiettivo tridimensio- 
nale P3 condurrà Cayley e Pliicker alla rappresentazione di una retta di P3? me- 
diante un punto di un’ipersuperficie di secondo grado di P* (coordinate pliicke- 
riane). S’introduce cos l’idea fondamentale che la geometria di entità complesse 
immerse in uno spazio ambiente triviale è traducibile nella geometria dei punti 
di uno spazio di descrizione: a) di dimensione eventualmente superiore a tre; 
b) globalmente non triviale. 

La geometria proiettiva permetterà altresi a Klein, nel suo programma di 
Erlangen, di unificare i diversi tipi di geometrie (cioè di struttura degli spazi am- 
bienti tipo) (cfr. l'articolo « Geometria e topologia » in questa stessa Enciclopedia). 

Parallelamente ai progressi della geometria proiettiva prenderanno corpo le 
nozioni di spazio vettoriale e di algebra lineare. Questa nuova estensione del 
concetto di spazio avrà una notevole importanza quando la si prolungherà al- 
l’analisi funzionale, quando cioè si tratterà una funzione come un «vettore » de- 
componibile secondo vettori base (analisi armonica e serie di Fourier) e si esten- 
derà l’analisi spettrale degli operatori lineari agli operatori differenziali. 

Le strutture della geometria proiettiva e dell’algebra lineare sono per essenza 
globali. Con Riemann s’introdurrà un’altra idea chiave, d’importanza capitale, 
poiché con i suoi effetti domina il presente tema nel suo insieme. Si tratta dell’idea 
di considerare «spazio » a tutti gli effetti ogni spazio ottenuto per incollamento 
di modelli locali, cioè di pezzi di spazio ambiente tipo. Si tornerà ampiamente 
su quest’argomento. Si noti semplicemente che quest'idea sovverte totalmente 
la nostra intuizione di spazio poiché rompe con «l'evidenza » che la struttura 
globale dello spazio si ottiene per diretta estensione dalla sua struttura locale. 
Con Riemann il problema del passaggio dal locale al globale si allontana da ogni 
intuizione e diventa una problematica matematica fondamentale. 


3. L'opposizione locale/globale nella teoria delle funzioni: il caso analitico. 
Riemann è l’iniziatore di due aspetti della dialettica locale/globale. Da un 


lato l'aspetto delle varietà riemanniane (cfr. $ 4) e dall’altro quello delle super- 
fici di Riemann brevemente delineato nel presente paragrafo. 
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Ciò che precede serviva ad introdurre il rapporto esistente tra l'opposizione 
locale [globale e il concetto di spazio, più precisamente di spazio ambiente. Vie- 
ne ora introdotto il rapporto tra tale opposizione e il concetto di funzione, in 


quanto la dialettica spazio /funzione è una delle chiavi di volta di tutta la geome- 
tria moderna. 


3.1. Le diverse classi di funzioni reali. 


Si consideri un polinomio a coefficienti reali, per esempio di secondo grado, 
P(x)=ax°+bx+e. Si tratta di una funzione P : R+R che associa a ogni nu- 
mero reale x un altro numero reale P(x) (detto valore di P in x), ottenuto me- 
diante l'algoritmo rappresentato dalla sua espressione algebrica. Si supponga P 
noto per tre valori distinti x,, x, e x3. I suoi coefficienti saranno allora le solu- 
zioni di un sistema di tre equazioni lineari in tre incognite: 


ax?+bx,+c= P(x,) 
(1) axî+bx,+c= P(x3) 
ax3+bx,+c= P(xs). 


l È facile vedere che se x1, x, € x3 sono distinti, il sistema (1) ammette solu- 
zione unica. Se dunque P è noto in tre punti distinti, è noto dappertutto. In 
generale, un polinomio di grado n è determinato quando siano assegnati i valori 
che esso assume in 2+1 punti distinti. 


Che un'informazione finita basti a caratterizzare P è un fatto cruciale che 
può essere localizzato. Se infatti x,, xy e x, sono infinitamente vicini, ossia si 
confondono in un punto xo, il dato (P(x,), P(x.), P(x,)) viene sostituito dal 
dato (P(x), P (*0), P'(x0)) ove P' e P” sono le derivate prima e seconda di P. 
Il sistema (1) viene allora sostituito con il sistema 

ax3+bxo+c= P(x9) 
(2) zax,+b= P'(x0) 
za=P" (xo) 


e si verifica facilmente la formula fondamentale 
x)? 
3) P()=P()+(-x%g) Pa) + EE pe(0. 
In generale ogni polinomio di grado n soddisfa una importante identità (4) 
detta formula di Taylor che permette di esprimerlo in funzione del suo valore 
e di quelli delle sue derivate successive in un punto qualsiasi xp: 


(4) P(A)=P(09)+ (6-30) Pio) +. + EZIO pg) 


: Lala î 
Ora la nozione di derivata è per sua natura locale. La formula di Taylor 
esprime dunque il seguente fatto molto importante: per i polinomi, la determi- 
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nazione locale implica quella globale. Per i polinomi, e più in generale per gli 
insiemi algebrici definiti da polinomi, esiste una solidarietà essenziale tra locale 
e globale. Si potrebbe dire che i polinomi manifestano un principio translocale 
«d’azione a distanza »: non si può perturbare un polinomio in un punto senza 
modificarlo dappertutto. 

Ciò è in netto contrasto con quanto avviene nel caso delle funzioni che sono 
semplicemente differenziabili. Infatti, per questo le perturbazioni locali non si 
«propagano »: due funzioni differenziabili possono coincidere localmente senza 
coincidere dappertutto (fig. 1). 

Ecco dunque delinearsi due domini estremi entro l’insieme delle applica- 
zioni f : R+R. Ad una estremità vi è il dominio caratterizzato da una proprietà 
di consistenza. Esso si estende dalle funzioni insiemistiche qualsiasi non aven- 
ti alcuna coesione neppure locale, fino alle funzioni indefinitamente differen- 
ziabili (di classe ©“), passando dalle funzioni continue (che possono essere mol- 
to «patologiche ») e dalle funzioni differenziabili fino all’ordine r (di classe €") 
per = 1, 2, ... In tale dominio, 4) non vi è alcuna solidarietà tra il locale e il 
globale; è) non esiste un’espressione, mediante simboli, delle funzioni. All’al- 
tra estremità vi è il dominio dei polinomi ove c) vi è solidarietà tra il locale ed 
il globale; d) esiste un’espressione delle funzioni, mediante simboli, che rende 
i polinomi degli algoritmi. (Cfr. fig. 2). 

Il problema consiste allora nel sapere come si raccordano questi due domi- 
ni; in altri termini, come si può, partendo dalla differenziabilità, raggiungere 
un'espressione simbolica e una solidarietà tra locale e globale. 

Partendo dai polinomi, la mediazione verso le funzioni differenziabili s'ef- 
fettua per estensione dal finito al numerabile. Si ottengono cosi le serie formali 
P(x)=a,t4,x+...+4,x"+... che sono in un certo senso polinomi di grado 
infinito. Ma passando cosf dal finito al numerabile nulla più garantisce che 
P(x) rappresenti un numero. Volendo delle serie che rappresentino funzioni, 
bisogna limitarsi a considerare serie convergenti. Se una serie è convergente per 
un valore xg, lo è per ogni altro valore x tale che |x|<|xg|. Essa lo è dunque in 
un intervallo |x|<R. R si chiama il suo raggio di convergenza. 

Partendo ora dalle funzioni ©*, la mediazione verso i polinomi s’effettua 
tramite il concetto di serie di Taylor. Se f è ©*, le si può associare, per ogni 
valore xo, la serie formale 7,,f, detta sua serie di Taylor in xo: 


(O Taf=f(0)+ (0-0) PETE pt 


8 
Figura 1. 
f e g sono localmente identiche senza esserlo globalmente. 
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che generalizza l’approssimazione lineare di f in x, mediante la tangente di 
equazione y=f(xo)+(x—xo) f(%). La serie di Taylor di f in xy è d’importanza 
fondamentale poiché esprime il miglior modo d’approssimare f mediante poli- 
nomi. Per definizione si tratta di un’entità locale. Quando x, varia, essa defini. 
sce dunque un'applicazione 7Y di R nell’algebra delle serie formali detta campo 
tayloriano di f e che «meglio » esprime come la consistenza differenziabile può 
«raggiungere » un’espressione simbolica. 

La nozione di serie di Taylor permette di «misurare » lo scarto tra funzioni 


coli e polinomi. È possibile constatare che tale scarto è irriducibile 
nfatti: 


a) La serie formale 7, f può essere divergente e pertanto non rappresentare 
alcuna funzione. Tale fenomeno di divergenza è ineliminabile, secondo un 
teorema di Borel per cui ogni serie formale può essere ottenuta come serie 
di Taylor. 

db) Anche se la serie 7, f è convergente, può rappresentare nell'intorno di 
x un altra funzione, diversa da f. Per esempio le funzioni dette piatte 
del tipo eV la cui serie di Taylor in o è identicamente nulla e rappre- 
senta dunque nell'intorno di o la funzione o e non la funzione stessa. 


Il passaggio tra i polinomi e le funzioni ©® s’effettua dunque in questo 


modo: 


a) «Vicinissimo » ai polinomi si trovano le funzioni @® esprimibili simbolica- 
mente, le quali manifestano una notevole solidarietà tra il locale e il glo- 
bale, cioè quelle per cui una determinazione locale implica la determina- 
zione globale. Si tratta delle funzioni ovungue rappresentate dalla loro se- 
rie di Taylor in ur punto qualunque. Tali funzioni diconsi intere. Esem- 
pio tipico ne è l’esponenziale e® che è ovunque uguale alla somma della 
sua serie di Taylor in o: 


2 
Te*= la 
2 n! 


b) Si trovano poi le funzioni localmente rappresentate in ogni punto dalla 
loro serie di Taylor. Esse diconsi analitiche. 
c) Si trovano infine le funzioni semplicemente @®, 


Funzioni Funzioni Ei 
; PPS) unzioni Funzioni a ; 
continue er «> e” «—_ Polinomi 


\——__y______y 
Consistenza Es i i i 
Assenza di solidarietà locale/globale pra Sr 


local 
uu ocale/globale 


Le classi estreme di funzioni. 
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Generalizzando tali risultati alle funzioni di più variabili, f : R°+R?, poi 
alle funzioni complesse, f : C*+C?, poi, per localizzazione ai germi di funzioni, 
ed ancora, per incollamento, alle funzioni definite su varietà qualunque, si pos- 
sono cosi definire livelli di struttura geometrica: il livello insiemistico, il livello 
topologico, il livello differenziabile, il livello formale (detto anche algebroide), il 
livello analitico ed infine quello algebrico corrispondente ai polinomi. Gran parte 
della geometria moderna è consacrata allo studio locale e/o globale di tali livelli, 
ai tipi di dialettica locale/globale che sono loro specifici, all'analisi dei vincoli 
che un livello inferiore esercita sui livelli superiori. Perché tali analisi andassero 
in porto è stato necessario elaborare strumenti generali la cui portata concettuale 
s'è rivelata considerevole. 


3.2. Prolungamento analitico e superfici di Riemann. 


L’analiticità acquista tutto il suo significato quando si passa dal reale al com- 
plesso e si considerano funzioni f : C+€C d’una variabile complessa, a valori 
complessi. Sia f una tale funzione. La si può considerare una f : R°?+R? che al 
punto z=x+y di R? associa il punto P(x, y) +i0(x, y) di R?, ove P e O sono 
due funzioni reali di due variabili reali. Se si tenta allora di definire per f il vin- 
colo di C-derivabilità in 2g, si constata subito che esso è totalmente diverso dalla 
R-derivabilità. Dire infatti che f è C-derivabile in 2, significa non solo che il 
rapporto [ f(2)—f(20)]/(8— 20) tende a un limite quando 3 tende a 3,, ma anche 
che tale limite è indipendente dal modo con cui x tende a 27. È facile vedere che 
per soddisfare tale vincolo occorre e basta che le funzioni P e O ammettano deri- 
vate parziali e soddisfino alle cosiddette condizioni di Cauchy-Riemann: 

dòP_òd0 dQ òP 


DD del de 
Se si suppone che P e O siano due volte R-differenziabili, tali condizioni im- 
plicano che P e O soddisfino l’equazione di Laplace: 


(6) AP=o0 AQ=0 


ove A è l'operatore laplaciano (ò?*/dx?) + (d°/dy?). 

Una funzione F(x, y) che soddisfa l'equazione di Laplace dicesi armonica; 
P e Q diconsi funzioni armoniche coniugate. 

Il fatto che, affinché f sia derivabile, P e Q devono soddisfare un’equazione 
alle derivate parziali, porta con sé una serie di notevoli conseguenze che fanno 
della C-derivabilità un vincolo che non ha nulla a che fare con quello della 
semplice R-derivabilità. Si noti anzitutto che la nozione di C-derivabilità è di 
per se stessa locale. Per passare al globale si considereranno dunque funzioni 
definite su aperti U di C e si dirà che esse sono C-derivabili su U se lo sono in 
ogni punto di U. 

Osservazione: La nozione topologica di aperto concretizza la relatività del- 
l'opposizione locale/globale. Un aperto, che per definizione è un intorno di ogni 
suo punto, può diventare vuoi un'entità locale quando lo si consideri sottospa- 
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zio di uno spazio globale, vuoi un'entità globale quando lo si consideri unione 
degli aperti in esso contenuti. 


Sia dunque f : U+C una funzione complessa definita su un aperto U di C 
e C-derivabile. 


a) Tutti i valori di f sono solidali. Tale solidarietà è espressa dalla formula 

integrale di Cauchy 

f= [LOC 

2it), 8-0 

la quale afferma che il valore di f in 85€ U è la media dei valori di f su 
ogni circuito di U orientato positivamente, che circondi 2, € che sia 
contraibile a un punto entro U. (Si dice in tal caso che il circuito Yè 
omotopo a zero). Una conseguenza fondamentale di ciò è il «principio di 
massimo » secondo cui se f non è costante, il suo modulo | f(2)| non può 
possedere né massimo né minimo. 

5) Se g è un’altra funzione C-derivabile definita su U, f e £ non possono es- 
sere localmente identiche senza esserlo globalmente. Per le funzioni C- 
derivabili una determinazione locale implica la determinazione globale 

c) f è necessariamente indefinitamente C-derivabile. 

d) f è di più C-analitica. 

e) f è di più C-intera. 


n Cosicché nel campo complesso la semplice derivabilità basta ad implicare il 
più potente vincolo di solidarietà tra locale e globale. Le funzioni C-derivabili 
e quindi C-analitiche per d), diconsi anche olomorfe. L’olomorfia è una nozione 
intrinsecamente locale ma che «passa » automaticamente al globale. È dunque 
naturale cercarne una caratterizzazione globale (teorema di Runge). 


La più notevole conseguenza della solidarietà locale/globale che caratterizza 
le funzioni C-analitiche è che la determinazione locale implica non solo la de- 
terminazione globale ma anche la determinazione dello stesso dominio di defi- 
nizione. Se f è localmente un polinomio, lo è dappertutto ed è definita su C. 
Ma nel caso generale il suo dominio naturale può essere molto diverso da C. 
Si è di fronte ad un totale capovolgimento di punto di vista poiché la nozione di 
«spazio substrato », di spazio soggiacente a una funzione, cioè in definitiva di spa- 
zio ove naturalmente la variabile indipendente 2 «sta di casa », non ha più senso 
che localmente, dato che la funzione stessa determina, a livello globale, il proprio 
spazio substrato. se 

Per precisare questo punto fondamentale, viene ora illustrata una descrizio- 
Te na da Weierstrass e poi chiarita in modo definitivo da Hermann Weyl 

1955). 

Sia f una funzione olomorfa su un aperto U di C. f si rappresenta in ogni 
punto col suo sviluppo di Taylor 7,,f in un punto 2,6 U. Per cogliere le pro- 
prietà di passaggio dal locale al globale è dunque naturale partire da T, Î cioè 
da una serie convergente 4(2)=a,+a, (#-2) + +4,(2-20)2+... Si chiama 
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elemento analitico (nel senso di Weierstrass) centrato in zo, e lo si o 
(4(2), 20), un tale dato. Questo elemento definisce localmente una funzione olo- 
morfa f il cui valore in , è il termine costante 49 della serie h(2). sogisi 
Sia dunque £= (4(2), 20) un elemento analitico centrato in 20. Sia A i va 
di centro 2, e di raggio R che è il disco di convergenza di A(2). Esistono 2 
punti singolari 2, del bordo di A nei quali la serie k(8) diventa divergente e che 
impediscono dunque l’estensione di f a un disco più grande di A con So in 
zo. Il fatto però che esistano tali ostruzioni non implica che non si possa po un- 
gare f ad un disco con centro in un punto 2, distinto da 29 che < fuoruscire be » 
da A evitando i punti singolari z, della sua frontiera. Infatti in un DORSO 
2; appartenente a À, f si può rappresentare mediante un elemento ana so 
(B(£), 21) centrato in 2,. Tale elemento possiede un disco di convergenza 
centrato in 2, e limitato da certe singolarità 2;. Nulla impone che A' sia contenuto 
in A. Inoltre il fatto che una funzione C-analitica sia globalmente determinata 
dalla sua struttura locale implica che le somme delle serie #(z) e B(3) sono 
identiche su ANA’. La funzione uguale alla somma di #() su A e alla somma 
di B(2) su A' è dunque ben definita e olomorfa su ANA”. E questo il DIRE 
del prolungamento analitico (fig. 3): il prolungamento analitico è definito in 
modo unico. Di tetra 
Per prolungamento analitico si estende cosî 1 elemento analitico di a 
(4(2), 20) in una funzione olomorfa globale f. Si potrebbe credere che i  domi- 
nio di definizione di f sia semplicemente il piano complesso privato dei punti 
singolari. Ma ciò non avviene in generale. Può succedere infatti che prolungando 
4 lungo una catena chiusa A, A', ... ecc. si torni all’intorno di 29 mediante un 
elemento analitico il cui valore in 2, sia diverso da quello di Ah). Considerata 
come definita su C, la funzione globale f sarebbe dunque multiforme. Ora, f, 
per costruzione, è uniforme. La chiave di questo apparente « paradosso » risiede 
semplicemente nel fatto che, com'è stato già detto, A(2) determina per prolun- 
gamento non solo f ma anche il suo spazio substrato. Tale spazio substrato non 
deve pit essere considerato in sé come uno spazio «esterno ) sul quale f sarebbe 
definita, ma come uno spazio intrinsecamente attaccato ad f. Lo si denoterà 


SO Z. . . . O l » d . 
Si può poi completare la costruzione tenendo conto dei punti singolari e dei 


Estensione del dominio 
di definizione di f c. 
per prolungamento analitico 


Figura 3. 
Principio del prolungamento analitico. 
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punti in cui X si ramifica. I punti singolari sono sia poli, sia punti singolari es- 
senziali. I punti di diramazione sono i punti 2, tali che f possiede n determina- 
zioni nell’intorno di #, ma meno di n determinazioni in 2. Il caso tipico viene 
fornito dalla funzione Vz che per ogni valore di 240 possiede due determina- 
zioni + 2, ma un sol valore (0) in o. Se allora si completa X mediante i poli e 
i punti di diramazione e la base C di £ mediante l’aggiunta di un punto all’infi- 
nito per tener conto dei poli e dei punti di diramazione all'infinito (cosa che for- 
nisce la sfera di Riemann ©), X diventa un rivestimento ramificato di € privato 
dei punti essenziali; esso dicesi superficie di Riemann dell’elemento analitico 
(4(2), 20) e della funzione globale f ch’esso determina per prolungamento ana- 
litico. 

La superficie di Riemann Y di f è canonicamente munita d’una proiezione 
2: Z+C che associa ad ogni elemento analitico di X il suo centro. Essa è anche 
evidentemente il dominio di f. Si ottiene dunque in definitiva lo schema 


xb € 
4 
E 


che evidenzia bene il radicale spostamento introdotto. X è lo spazio globale ove 
naturalmente «sta di casa » la variabile indipendente 2. Soltanto localmente la x 
continua ad essere una variabile. Globalmente essa diventa la proiezione cano- 
nica della superficie di Riemann di f. Come nota Weyl: «Prima di iniziare lo 
studio di una classe di funzioni si deve definire la superficie che è il dominio 
della variabile indipendente; si deve poi stabilire cosa significa funzione ana- 
litica su tale superficie che diventa cosî una superficie di Riemann. Solo a que- 
sto punto ci si può occupare delle funzioni stesse » [1955, p. 43]. 

Osservazione: Il fatto che 8 diventi una funzione e non più una variabile 
pone il problema, detto dell’uniformizzazione globale, di sapere se il suo statuto 
di variabile può essere «recuperato » in uno spazio differente (cfr. oltre). 


3.3. Richiamo dei lavori di Riemann sulle curve algebriche. 


La nozione di superficie di Riemann acquista tutto il suo significato nel caso 
in cui 2 ed f sono legate da una relazione algebrica, cioè annullano un polinomio 
in due variabili P(z,f)=o. In tal caso essa fornisce uno straordinario stru- 
mento atto allo studio delle funzioni analitiche; la grande idea di Riemann è in- 
fatti che la superficie di Riemann X d’un elemento analitico — esattamente come 
lo è € — deve essere considerata come spazio substrato naturale per delle fun- 
zioni analitiche. 

1) Sia C' una curva algebrica di C?, cioè l'insieme dei punti (2, w%) di C? che 
annullano un polinomio irriducibile, P(2, w). C è una superficie di Rf. L’analisi 
locale di C si divide in due parti. 

La prima è quella della struttura di C' nell'intorno d’un punto regolare, cioè 
d’un punto (x, 20) in cui le due derivate parziali dP/dz e dP/dw non sono en- 
trambe nulle. Il teorema fondamentale al riguardo è il seguente: 
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TEOREMA DELLE FUNZIONI IMPLICITE. .Se (z, w)e C* è tale che òP/dw#0, C 
è, localmente, in (2, w) il grafico d’una funzione analitica w=w(2). 


Osservazione: Poiché in un punto regolare si ha (òP/ dw) #0, oppure 
(dP/dz)#0, se (dP/dw)=0, 2 sarà localmente esprimibile come funzione ana- 
litica 2(%w) di w. iu . 

Il teorema delle funzioni implicite è fondamentale poiché mostra che, in un 
certo senso, l’analitico permette di localizzare l’algebrico. Pertanto, partendo 
dall’espressione analitica locale w= (2) si riottiene (0) per passaggio al globale, 
grazie al principio del prolungamento analitico. Quello ch'è in gioco non è tan- 
to la solidarietà locale/globale comune all’algebrico e all’analitico, quanto la for- 
ma dell’equazione che definisce la curva C. Dire che il polinomio P(8, w) di 
cui C è il luogo degli zeri è irriducibile, significa che non può essere ridotto alla 
forma di base w=w(3): P(2, w)=o è un'equazione algebrica globale non ri- 
ducibile a una funzione f : C+C. Le equazioni analitiche locali invece, di cui il 
teorema delle funzioni implicite afferma l’esistenza, sono proprio della forma di 
base w= (2). Ma non sono equazioni globali. Esse variano al variare del punto 
(regolare) scelto. Siena É 

L’interpretazione geometrica del teorema delle funzioni implicite è semplice 
(fig. 4). Si consideri la proiezione canonica x : (2, w)>z. Il teorema afferma 
essenzialmente che, laddove tale curva è trasversa alle fibre di T, essa è local- 
mente una sezione di rr, se si chiama sezione di x un’applicazione analitica 
w:C+C? tale che 7ow=Idc. i 

Lo studio locale di C' nell’intorno dei suoi punti singolari (necessariamente 
isolati) ove (0P/dz)= (dP/dw)=0 è più complicato. Sì fa vedere che C si de- 
compone in rami (in corrispondenza alle diverse tangenti) analiticamente irridu- 
cibili (teoria degli sviluppi di Puiseux). i 

Infine l’analisi della struttura globale di C conduce nuovamente alla nozio- 
ne di superficie di Riemann. Si scriva infatti il polinomio P(2,w) nella forma 


P,(w)= an(2)+a;()w+...+a(2)0" 


Punto di Sezioni locali di x 


non trasversalità 


| 


=» Fibre di x 


Figura 4. 
Interpretazione geometrica del teorema delle funzioni implicite. 
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con i coefficienti 4;(2) polinomiali, e si associno ad ogni valore di < le x radici 
di P,(w); si ottiene allora una presentazione della curva C, completata dei suoi 
punti all’infinito, sotto forma di un rivestimento ramificato di C. 

Ancora più significativa è la proprietà reciproca: 


TEOREMA. Se la superficie di Riemann X di una funzione analitica f è com- 
patta, allora f verifica un’equazione algebrica P(z,f)=o. In altre parole, X st 
identifica con una curva algebrica protettiva C. 


È impossibile sottovalutare l’importanza della rottura epistemologica intro- 
dotta da Riemann nel porre la dialettica locale/globale al centro dello studio delle 
funzioni analitiche e delle curve algebriche. Questo nuovo punto di vista, che è 
un punto di vista sintetico, è infatti all'origine di tutta la geometria algebrica 
moderna. Cosi scrive Dieudonné: «Il periodo... senza dubbio più importante 
di tutta la storia della Geometria Algebrica... è interamente marcato dall’opera 
d’un solo uomo, Bernhard Riemann, uno dei più grandi matematici che siano 
mai esistiti, uno di quelli che hanno più profondamente sentito (o divinato) l’u- 
nità essenziale della matematica» [1947, p. 42]. Utilizzando il linguaggio ana- 
logico del $ 1, si potrebbe dire che l’opera di Riemann costituisce il primo esem- 
pio d’uno stato «eccitato » globale dell’universo matematico. 

2) Una superficie di Riemann compatta, cioè, per quanto visto, una curva al- 
gebrica proiettiva (piana), possiede quattro livelli di struttura. Il livello soggia- 
cente è quello topologico. Il livello intermedio è quello differenziabile. I livelli 
superiori sono l’analitico e l’algebrico i quali, come s'è visto, coincidono. Una 
delle grandi idee introdotte e sviluppate da Riemann è che il livello topologico 
vincola i livelli superiori. Tipico al riguardo è il concetto di genere. Esiste in- 
fatti una classificazione topologica delle superfici connesse, compatte ed orien- 
tabili: ogni superficie connessa, compatta ed orientabile è omeomorfa a una sfera 
con g manici o anche a un toro con g buchi. Il numero & dicesi genere della su- 
perficie (fig. 5). 

La superficie di Riemann X di una curva algebrica proiettiva essendo una 
superficie connessa, compatta ed orientabile possiede genere ben definito. T'ale 
invariante topologico è fondamentale per comprendere i fenomeni di periodi- 
cità posseduti dagli integrali abeliani. Lo si può calcolare a partire da una qua- 
lunque presentazione di X come rivestimento ramificato di €. 

L’introduzione del genere pone subito il difficile problema di classificare le 


Figura 5. 


Genere di una superficie. 
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superfici di Riemann compatte che hanno ugual genere (problema dei moduli). morfa (rispettivamente meromorfa) su 2. Esse formano ovviamente uno spazio 
3) Una superficie di Riemann compatta X è, come s'è detto, un substrato vettoriale su Cc. i 
geometrico-topologico naturale quanto C. È dunque logico sviluppare la teoria Uno dei primi grandi risultati di Riemann è che, se le funzioni olomorfe su 
delle funzioni analitiche (con singolarità) su Z. Poiché X è compatta, le sole ® sono costanti (si suppone naturalmente che X sia compatta), non altrettanto 
si funzioni che siano ovunque olomorfe su X sono le costanti. Quanto alle funzioni accade per le 1-forme olomorfe (dette di prima specie) e questo per ragioni do- 
meromorfe, esse sono necessariamente razionali cioè funzioni razionali di 2 e ue al vincolo esercitato dal livello topologico sul livello analitico-algebrico. 
di w per ogni coppia (2, w) che definisce X come curva algebrica. Ciò significa Più pr ecisamente, sia X di genere g30. La sua omotopia e la sua omologia 
ch che il corpo K delle funzioni meromorfe su X è il corpo C(z, w) generato su Cc sono allora non triviali. Esistono su X dei cappi omotopicamente non triviali 
11) da 2 e w. Ma poiché w è funzione algebrica di 2, K è un’estensione algebrica di che non si possono contrarre a un punto entro X, ovvero esistono dei cicli omo- 
il grado finito del corpo C(2) avente grado di trascendenza 1 su C. Reciproca- logicamente non triviali (fig. 6) che non sono bordo di alcun disco di X. X dicesi 
mente, dato un tale corpo X, esso è il corpo delle funzioni meromorfe sulla su- non semplicemente connessa. 
perficie di Riemann della curva algebrica d’equazione P(z, w)=0 ove w è un Bisogna notare che tale difetto di connessione semplice non dipende qui da 
generatore di K su C(z) e P il suo polinomio irriducibile. Si possono dunque cause locali (come ad esempio nel caso del piano bucato) ma da cause globali 
considerare equivalenti due curve algebriche i cui corpi di funzioni meromorfe E facile vedere che, poiché X è di genere g, esistono 2g cicli omologicamente 
sono isomorfi. Tale è il punto di partenza della geometria birazionale. A meno non triviali «indipendenti » (cioè tali che ogni ciclo omologicamente non triviale 
di equivalenza birazionale la teoria delle curve algebriche s’identifica dunque possa scriversi in modo unico come una loro combinazione) e che possono essere 
con quella delle estensioni algebriche finite del corpo di base C(z). Si tratta di scelti come g coppie disgiunte (1, di)...(Yy» d,) di cicli «coniugati » (fig. 7) che 
un punto decisivo poiché, come è stato mostrato da Dedekind e Weber, questa gener alizzano le nozioni di «paralleli » e «meridiani » del toro. 
teoria è essenzialmente analoga a quella delle estensioni algebriche finite del Tagliando X lungo una tale base di cicli si ottiene una superficie (con bordo) 
corpo primo Q dei numeri razionali, cioè alla teoria dei numeri algebrici. Ap- semplicemente connessa. 
KI pare cosi un profondo nesso tra geometria ed aritmetica e nasce una teoria geo- , Si può allora far vedere che ad ogni coppia (Y;, è;) d’una tale base di cicli 
| ‘metrico-aritmetica dei corpi globali (estensioni algebriche finite di Q o di C(3)) si può associare una I-forma olomorfa «; in modo da soddisfare il seguente 
l che più tardi sarà collegata ad una teoria dei corpi locali. Lo sviluppo di tale TEOREMA (Riemann). Le 1-forme olomorfe %,, ..., ©, formano una base del 
| sintesi è la base della geometria algebrica astratta. l | C-spazio vettoriale delle 1-forme olomorfe (cioè di prima 3. Dese) 
il 4) Poiché una superficie di Riemann è un substrato geometrico-topologico ì 
ill naturale, vi si può sviluppare una teoria dell’integrazione. È tale punto di vista 5) Le 1-forme sono fatte per essere integrate lungo cammini di X e defini- 
IU quello che conduce ai risultati più ricchi. $i considerino dunque le forme dif- scono per integrazione delle primitive. Il problema è di sapere se tali primitive 
iI ferenziali su X (cfr. l'articolo « Differenziale» in questa stessa Enciclopedia) e sono uniformi su X. Sia o un punto base di X. Sia © una 1-forma olomorfa 0 
Lil dapprima le forme differenziali a coefficienti differenziabili. Siano (x, y) coor- meromorfa. P E definire il valore in un punto a della primitiva F di ©, si consi- 
dinate reali locali di X (come superficie differenziabile). Le o-forme sono le fun- dera un cammino y che va da o ad a e si pone F(a)=/,%. Perché F sia ‘uniforme 
A zioni differenziabili f : YZ+R oppure f : 2—C. Le n-forme sono nulle per n>2 in a, occorre e basta che l'integrale f_,&w non dipenda dal cammino Y scelto tra 
‘I (poiché © ha dimensione 2). Le 2-forme sono le densità f(x, y) dx dy, ove f o ed a. Se y e Ya sono due tali cammini e Y il ciclo Yj—Ys, la condizione ne- 
(n è una funzione differenziabile, e quanto alle 1-forme (le più interessanti) esse CATA sufficiente d’unifor mità in a è pertanto f,©w=0 e la condizione neces- 
ili sono del tipo w= @(x, y) dx+5(x, 7) dy ove a(x, 9) e d(x, y) sono funzioni, dif- saria e sufficiente d’uniformità globale è {© =0 per ogni ciclo y. 


ferenziabili. Tra le 1-forme a valori complessi, vi sono le 1-forme olomorfe (ri- Si può dedurre da tale condizione che esistono essenzialmente due tipi di 
spettivamente meromorfe) del tipo w=a(2) dz, ove a(2) è una funzione olo- 


iI Ciclo 
. I omologicamente triviale Ciclo 


i : non omologicamente triviale 
ill Figura 6. Figura 7. _ 
Non trivialità dell’omologia del toro (g=1). Base di cicli coniugati del doppio toro (g=2). 
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ostruzione all’uniformità delle primitive, l’uno locale e l’altro globale. Si con- 
sideri dapprima quello locale. Sia w= 4(2) dz e En" lo sviluppo di 


Laurent (che generalizza lo sviluppo di Taylor) nell'intorno di un polo Zo di w. 
Nell’intorno di 2, F si ottiene integrando la serie di Laurent termine a ra 
Se 1-1, l'integrazione di (2—2)" dà (2—20)?1!/(n+ 1) che è uniforme. A 
però n= -—1, l’integrazione di (z—2,) ! dà log(z—z0) chechna funzione ra 
tiforme. Infatti il logaritmo d’un numero complesso 2 = pe'® è dato dalla formula 


(9) logg=logp+i(9+2K7r), 


ove Ke Z. Tale ostruzione locale all’uniformità s’esprime attraverso la nozione 
intrinseca di residuo. Il residuo di © in uno dei suoi poli 2p è il RR 
che ha un significato indipendente dalla scelta della coordinata locale 2 ed è dato 
dalla formula 


I 
=T | ® 
(10) di 3 ’ 


ove y è un «piccolo » ciclo (orientato positivamente) attorno a 2 (« piccolo i si- 
gnifica che y è contenuto in un intorno semplicemente connesso di 20). Se w 
ammette residui non nulli v'è ostruzione locale all’uniformità della sua primitiva 
F, poiché F presenterà singolarità logaritmiche. a RAI 
S noti a questo proposito uno degli aspetti cruciali della solidarietà locale / 
globale. C 
TEOREMA DEI RESIDUI. La somma dei residui di una 1-forma meromorfa su di 
una superficie di Riemann compatta X è sempre nulla. 


Applicando tale teorema alla 1-forma [ f'(2) dz]/[f(2)--c] si mostra ao 
mente che una funzione f meromorfa su X prende esattamente lo stesso nu 
mero di volte ogni valore ce C. In particolare il numero di poli di f I do 
la loro molteplicità) è uguale al numero dei suoi zeri (contati con la loro mol- 
e ora al problema dell’ostruzione globale all’uniformità, si n 
dapprima le ostruzioni locali considerando soltanto le 1-forme pra P -- 
ve di residui. Si dimostra che questa condizione locale dipende dal ivello di 
ferenziabile e si esprime affermando che il differenziale dw di © è la 2-forma 
nulla. Tali 1-forme diconsi chiuse e si chiamano esatte le 1-forme chiuse parti 
colari che sono i differenziali w= df di o-forme (cioè la cui primitiva è uni- 
forme). Le forme esatte sono chiuse poiché d*=o. Le 1-forme chiuse sono 

ue le 1-forme localmente esatte. l ; 
su: primo risultato è che l’integrale fo di una 1-forma chiusa O) i ha i 
y dipende solo dalla classe d’omologia di y ed è dunque nullo seyèi » to 
un disco di X. L’ostruzione globale all’uniformità delle primitive delle 1-forme 
chiuse proviene dunque essenzialmente dal fatto che l’omologia x a è deo 
triviale, cioè il suo genere non è nullo. Se y è un ciclo che non è sn ordo, l’in- 
tegrale {,, si chiama un periodo di w. Si ha il seguente teorema: 
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TEOREMA. Una 1-forma chiusa w è esatta se e solo se J,W=0 per ogni ciclo 
Y, cioè se e solo se tutti i suoi periodi sono nulli. 


In generale si possono considerare i funzionali lineari Z che associano a un 
ciclo y un numero complesso /(y) che dipende linearmente da y- Diconsi chiusi 
i funzionali che si annullano sui bordi. Questi sono le forme lineari sullo spa- 
zio vettoriale 77, quoziente dello spazio dei cicli per lo spazio dei bordi. Il loro 
spazio 1! è dunque il duale di H, (cfr. l'articolo «Dualità » in questa stessa 
Enciclopedia). Di qui il nome di spazio di coomologia attribuito ad 77! 

La teoria coomologica delle 1-forme permette di risolvere concettualmen- 
te il problema degli integrali abeliani ed in particolare ellittici (si tratta del pro- 
blema inizialmente considerato da Riemann. Cfr. gli articoli «Invariante », $ 12, 
e «Funzioni», $ 7, in questa stessa Enciclopedia). 

6) Come si è già notato, le primitive delle 1-forme su una superficie di Rie- 
mann Y possono essere multiformi. Si possono però rendere uniformi sul rivesti- 
mento universale X; di X. Tale nozione di rivestimento è al centro della topologia 
algebrica. Data una superficie astratta Y (connessa) si chiama rivestimento (non 
ramificato) di % una superficie 2’ munita di una proiezione x : £/+Y che è 
un omeomorfismo locale di fibra discreta. Ciò significa che l’immagine inversa 
mediante 7 di un aperto abbastanza piccolo A di X è una «pila » di aperti di 2’ 
omeomorfi a A. Il caso banale è quello in cui 2’ è globalmente una «pila » di 
esemplari di X, cioè il prodotto diretto di X per una fibra discreta. X' è allora 
non connessa. Il caso non banale è quello in cui 2’ è connessa. Per esempio 
identificando le coppie di punti antipodali di una sfera JS? si fa di S? un rivesti- 
mento connesso a due fogli del piano proiettivo reale. 

La teoria dei rivestimenti fornisce un ottimo esempio di unità della matema- 
tica, cioè d’isomorfismo tra teorie i cui domini di oggetti sono molto diversi. 
Essa è infatti formalmente identica alla teoria di Galois delle estensioni algebri- 
che dei corpi. 

Riprendendo in esame le superfici di Riemann, esse possiedono rivestimenti 
che sono ancora superfici di Riemann. Peraltro esiste un teorema di classifica- 
zione delle superfici di Riemann semplicemente connesse. 


TEOREMA (Koebe). Ogni superficie di Riemann semplicemente connessa è ana- 
littcamente isomorfa alla sfera di Riemann € (cioè alla retta protettiva complessa 
Pi), oppure al piano complesso C, oppure all’interno A del disco unità di C. 


Osservazione: La struttura analitica di A ne fa un modello del piano iper- 
bolico (cfr. $ 2.1). A ciò è dovuto il fatto che la geometria iperbolica è rientrata 
nell’universo standard di ogni matematico. 

Perciò ogni superficie di Riemann si ottiene come quoziente di €, C oppure 
A rispetto a un gruppo di automorfismi della loro struttura analitica. In partico- 
lare è questo il caso per le superfici di Riemann compatte. Il genere o corri- 
sponde a €, il genere 1 (curve ellittiche) ai quozienti di C rispetto a dei reticoli, 
i generi g>I a quozienti di A rispetto a gruppi (discreti) di automorfismi della 
sua struttura iperbolica (gruppi fuchsiani). Se allora si considera una 1-forma 


Locale/globale 454. 


e su una superficie di Riemann compatta X, e se si suppone che sia chiusa, cioè 
che l’ostruzione all’uniformità della sua primitiva F sia globale e provenga dal- 
l’omologia non triviale di X, tale ostruzione scompare allorché si risale a È. Cal- 
colata in £, la primitiva di @ diventa globalmente uniforme. Dire che F è già 
uniforme su X è quanto dire che i suoi periodi sono nulli. 

Osservazione : Si è visto che nella concezione riemanniana 2 poteva essere con- 
siderata solo localmente come una variabile indipendente e che globalmente 2 
era in effetti la proiezione d’un rivestimento ramificato 2 : Z+C. Si può dire 
ora che X è il luogo ove < ritorna ad essere globalmente una variabile indi- 
pendente. 


Per concludere la rapida rassegna dello straordinario rimescolamento di idee 
e di risultati generati dall’introduzione (da parte di Riemann) della dialettica 
locale/globale nella teoria delle funzioni analitiche, andrebbe ancora ricordato 
il celeberrimo teorema di Riemann-Roch per il quale si rimanda agli articoli 
«Geometria e topologia » e «Invariante » in questa stessa Enciclopedia. 

La generalizzazione di tale sintesi in dimensione superiore si è rivelata irta 
di difficoltà (teoria delle superfici algebriche prima, degli insiemi algebrici poi) 
e ha rappresentato la punta avanzata di tutta la geometria algebrica contem- 
poranea. 

Può allora sembrare che l'assenza di solidarietà locale /globale nel caso dife- 
renziabile tolga ogni speranza di stabilire in tal caso una sintesi di cosi vasta por- 
tata teorica e concettuale. Ma si vedrà che ciò è completamente falso e che la to- 
pologia differenziale moderna conduce a una nuova dialettica del locale e del 
globale che, pur essendo molto diversa da quella cui è stato fin qui accennato, 
non è meno armoniosa ed elegante. 


4. L'opposizione locale/globale nella teoria delle funzioni: il caso differen- 
ziabile. 


4.1. Il paradigma catastrofista. 


Sia f : R+R una funzione €” di una variabile reale a valori reali. Si è visto 
al $ 3.1 che se essa non è analitica non sussiste alcuna solidarietà globale delle 
sue determinazioni locali. In modo intuitivo si può dire che la sua consistenza 
«non si traduce in formule »: non esiste espressione simbolica (algoritmo) che 
permetta di calcolare f. Naturalmente i metodi del tipo sviluppo di f in serie di 
Fourier permettono di approssimare f. Ma ciò non scioglie il nodo «filosofico » 
consistente nel fatto che l’identità di f è ideale (non costruibile). Si può dunque 
subito ipotizzare che il principio -d’identità concreto proprio di f sia qualitativo, 
cioè strettamente più debole del principio d’identità classico e deve dunque es- 
sere definito come una relazione d’equivalenza (che verrà indicata con =) sullo 
spazio 3 delle funzioni ©* da R in R. Bisogna perciò concettualizzare quest’equi- 
valenza che deve essere naturale. 
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Si consideri il grafico di f. Si tratta di una curva C; del piano R?. Si vuole 
che le funzioni f e g rappresentate nella figura 8 siano equivalenti. Cosa c'è di 
comune tra f e g? Qual è il dato qualitativamente invariante che determina fe- 
nomenologicamente l’equivalenza fg? 

Il lettore intuirà facilmente che tale dato si riduce all'informazione finita e 
locale che costituisce la «configurazione critica » di f, cioè: 


a) il numero dei punti critici di f (ossia dei punti a tangente orizzontale di 
C;) e il loro tipo (massimo o minimo). Nell’esempio considerato, due mi- 
nimi #2, e #1, e un massimo /M,; 

b) l'ordine m,<M,<m, di questi punti critici; 

c) l’ordine f(m,)<f(ms)<f(M;) dei valori critici corrispondenti. 


In base a una tale configurazione critica esiste un solo modo di ricostruire F 
a meno di equivalenze: la configurazione critica di f determina il suo tipo qua- 
litativo globale (fig. 9). 

Certo, questa intuizione di cui il lettore dovrebbe fidarsi s'imbatte subito 
— come del resto ogni intuizione — in notevoli difficoltà. I punti critici di f pos- 
sono infatti essere più complicati che non dei semplici massimi o minimi (pos- 
sono essere degeneri: cfr. oltre). Nonostante tutto, tale intuizione radicata nel- 
la fenomenologia della percezione è originaria per un nuovo tipo di dialetti- 
ca tra locale e globale, il quale è matematizzabile e spalanca un vero e proprio 
universo. 

Verrà dapprima mostrato che la nozione di tipo qualitativo introdotta in 
modo intuitivo corrisponde infatti esattamente al principio naturale d'identità, 
che tiene conto dei seguenti fatti: a) f è un’applicazione tra uno spazio sor- 
gente e uno spazio bersaglio; 5) il livello di struttura che si considera è quel- 
lo differenziabile. 

Il punto a) può essere abbordato in un contesto generale (in qualche misura 
è universale). Sia C' la categoria (cfr. l'articolo «Applicazioni » in questa stessa 
Enciclopedia) degli insiemi muniti di un certo tipo di struttura. Sia Hom (MM, N) 
l'insieme dei morfismi f : M-+N tra due oggetti M ed N di C, ossia l'insieme 
delle trasformazioni che rispettano la loro struttura. Quale sarà l'identità strut- 
turale, cioè il grado di discernibilità di un elemento fe Hom(M, N)? Essa deve 


Figura 8. 


Equivalenza qualitativa di due funzioni. 
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«corrispondere » al grado di discernibilità degli elementi della sorgente (M) e 
del bersaglio (N) di f. Orbene, l’indiscernibilità degli elementi di un oggetto X 
di C è misurata dalle «simmetrie interne » di X, ossia dal gruppo degli automor- 
fismi di X, o in altri termini dal gruppo delle permutazioni di X che lasciano in- 
variato l’insieme delle interrelazioni strutturali tra gli elementi di X. Si arriva 
dunque in modo naturale alla seguente definizione. Sia Gy (rispettivamente 
Gy) il gruppo degli automorfismi di M (rispettivamente di N). Il prodotto di- 
retto G= Gy X Gy opera in Hom(M, N) e definisce in esso delle classi d’equi- 
valenza. 


DEFINIZIONE. Siano f e g due elementi di Hom(M, N). f e g sono equivalenti 
(fg) se esistono un automorfismo ge Gy e un automorfismo pe Gy tali che îl 
diagramma 7 

MN 
Cal iO 
MN 


sia commutativo, cioè tale che g=po0fo pt. 


Passando allora al punto b), poiché il livello di struttura considerato è quello 
differenziabile, si devono considerare il gruppo Diff R dei diffeomorfismi di R 
(cioè degli automorfismi della struttura differenziabile di R) e l’azione di G= 
= Diff Rx Diff R sullo spazio F delle funzioni @® di R in R: f, geF saranno 
equivalenti se esistono 9, pe Diff R tali che g=W0fo p_!. Orbene, è facile ve- 
dere che ciò che è comune a una classe d’equivalenza, o in altre parole ciò che 
è invariante rispetto all’azione di G, è esattamente la configurazione critica delle 
funzioni. Più precisamente, se x, è un punto critico di f, la serie di Taylor 
T,,f di f in xp inizia (a parte il termine costante f(x,)) con un termine 
(x-xo)2[f"(x0)/n!]. L'intero n dicesi ordine del punto critico. I diffeomorfi- 
smi mantengono l’ordine dei punti critici e il segno di f"(xy) (cioè la qualità 
di minimo, di massimo o di punto di flesso anche degenere) come anche l’ordine 
rispettivo dei punti critici e dei valori critici. 


Figura 9. 


La configurazione critica di f determina globalmente il suo tipo qualitativo. 
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Osservazione: Ciò che s’è detto vale solo per quei diffeomorfismi di R che 
si ottengono per deformazione dell’applicazione identica di R. Se si accettano 
i diffeomorfismi di R ottenuti per deformazione della simmetria x —x, viene 
globalmente invertito sia l’ordine dei punti critici, sia quello dei valori critici, 
sia entrambi. L'essenziale è però che un diffeomorfismo non può invertire tali 
ordini parzialmente e passare per esempio dall’ordine mj<M,<my<M, all’or- 
dine my <My<my<M,. 


Ciò ch'è stato dunque battezzato il tipo qualitativo di f è semplicemente il 
suo tipo differenziabile. Questa nozione cruciale chiarisce e riduce in maniera 
sostanziale lo scarto, di cui al $ 3.1, tra la struttura locale di una funzione dif- 
ferenziabile e il suo sviluppo di Taylor. Sia fe T. I troncamenti successivi di 
T.,f che esprimono la migliore successione di approssimazioni locali di f me- 
diante polinomi diconsi getti di f in x. Sebbene 7,,f non rappresenti f in xo, 
può ragionevolmente avvenire che f sia localmente equivalente ad uno dei suoi 
getti. In tal caso si afferma che f è di determinazione finita in x). Se per esempio 
f(x) #0, si può dimostrare che f è determinata dell’ordine 1 in xy: mediante un 
cambiamento differenziabile di coordinate, f si scrive in un intorno di x, nella 
forma f(x)=f(x)+(x—x0) f(x). Analogamente, se x, è un punto critico d’or- 
dine 2 (punto critico non degenere), f è determinata dell’ordine 2 in xy: median- 
te un cambiamento differenziabile di coordinate f si scrive in un intorno di xy 
nella forma f(x)=f(x0)+ (+—xo[f"(#)/2]. 

La nozione di determinazione finita, che può essere generalizzata, è program- 
matica. Nel caso differenziabile si cerca di «trasferire ) nei cambiamenti di coor- 
dinate lo scarto tra il differenziabile e l’analitico-algebrico e si analizza «ciò che 
resta» dopo tale passaggio. Nei casi favorevoli, ciò che resta è algebrico e per- 
mette dunque il calcolo. Ecco uno dei tanti esempi. Sia X un campo di vettori 
©” su una varietà differenziabile M. Ciò significa che ad ogni punto x di M 
si associa un vettore X (x) tangente ad MM in x e che varia in modo differenzia- 
bile al variare di x. Dato un punto O di 4, si vuol sapere se, a meno di equi- 
valenze, X è localmente di forma semplice in O. Se X(0)o0, il classico teo- 
rema d’esistenza delle soluzioni di un’equazione differenziale del prim’ordine 
afferma che X è equivalente nell'intorno di O ad un campo costante. Se X(0)= 
=0, cioè se O è un punto singolare del campo X, si tratta di sapere sotto quali 
condizioni X è localmente determinato dal proprio getto d’ordine 1 ossia equi- 
valente al campo lineare X di coordinate 


(ove (x,, ..., x.) sono coordinate locali di M in O ed X, le coordinate di X). In 
tal caso si dirà che X è linearizzabile (in O). Sia A la matrice nx x 
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È facile dimostrare che i suoi autovalori ,, ..., A, sono degli invarianti del tipo 
differenziabile di X. Si ha allora il seguente risultato: 


TEOREMA DI POINCARÉ-STERNBERG. Se per ogni n-pla (î,, ..., in) d’interi tali 
n 


che i,+...+i,=2, e se per ogni je (1, ..., n) si ha \;-)iAx#0, allora X è li- 
nearizzabile (in O). k=1 


[Per la dimostrazione di tale teorema e delle sue conseguenze ci si può rife- 
rire a Roussarie 1975]. 


Ma si può andare ben più lontano. Lo spazio 3 è infatti munito d’una topo- 
logia, detta topologia ©”, adattata al livello differenziabile, ossia la topologia 
della convergenza uniforme di f e di tutte le sue derivate sui compatti di R. 
Orbene dal momento in cui si dispone su un insieme di una topologia e di 
una relazione d’equivalenza è possibile definirvi una nozione di stabilità strut- 


turale. 


DEFINIZIONE. Si dice che fe F è strutturalmente stabile se esiste un intorno di 
f per la topologia di 3, tutti gli elementi del quale sono equivalenti ad f. 


In altri termini, f è strutturalmente stabile se il suo tipo qualitativo « resiste » 
a piccole deformazioni. 

Sia allora K l’insieme degli elementi di F strutturalmente instabili. K dicesi 
l’insieme di biforcazione (o l’insieme catastrofico) globale di F. Qui s’introduce 
una nuova idea chiave: K è un sottospazio discriminante che classifica i tipi 
qualitativi stabili degli elementi di &. È in effetti intuitivo che se si vuole pas- 
sare da un tipo stabile a un altro, il principio di continuità esige a priori che si 
passi per un tipo instabile intermedio, cioè che si attraversi K: K decompone 
FX.K in «cellule» aventi per bordo K ed associate ai tipi stabili. Almeno nei ca- 
si semplici, K avrà una geometria relativamente tipica. Il problema sarà dun- 
que di vedere in qual misura la decomposizione di 5 in orbite di G (cioè in clas- 
si d’equivalenza) può «leggersi» sulla geometria di K (che è evidentemente G- 
invariante). Cosi nasce un nuovo paradigma, il paradigma catastrofista, che da 
una parte riposa sullo stato globale «eccitato » (nel senso del $ 1) dell'universo 
matematico costituito dalla topologia differenziale moderna e dalla teoria delle 
singolarità, dall’altra dà adito a una fusione totalmente nuova dei principî della 
filosofia naturale (cfr. l'articolo «Catastrofi » in questa stessa Enciclopedia). La 
forza di tale paradigma proviene dal fatto che offre la prima interpretazione ma- 
tematica globale e coerente di un fenomeno universale che la scienza classica ha 
sempre tentato di rifiutare e che la filosofia, al contrario, ha sempre fatto di tutto 
per conservare, cioè quello della trasformazione delle forme. 

Se ne indicherà ora qualche aspetto. 
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4.2. Stabilità e trasversalità. 


Un primo problema è quello di trovare dei criteri intrinseci e geometrici che 
caratterizzino la stabilità strutturale definita per ora in modo puramente «ester- 
no » rispetto a uno spazio globale &. Si riprenderà il caso in cui $ è uno spazio di 
funzioni differenziabili f : M+R di una varietà differenziabile M nella retta reale 
(teoria di Morse). Si accennerà invece qui a un problema risolto da Whitney che 
dà origine al «programma di 'Thom-Smale » sullo studio delle singolarità delle 
applicazioni differenziabili (per i legami con la struttura di M cfr. oltre, p. 472). 

Si analizzino ora dal punto di vista «fenomenologico », ossia qualitativo, le 
applicazioni differenziabili f : R*+R? del piano in sé. Una tale f associa a un 
punto x= (2 xp) di R? un punto f(x)=(f.(x,, x»), f.(*,, x»)) di R?. Localmen- 
te due casi sono possibili: f è un diffeomorfismo oppure f non lo è. Nel primo 


caso la jacobiana 7(x) di f in x, cioè la matrice 2x2: Zi) (i,j=1,2), ma- 
Kan 
j 


trice dell applicazione tangente Dyf : T,R°>TxR® di f in x (cfr. l’articolo 
« Differenziale » in questa stessa Enciclopedia), è invertibilé, cioè a determinante 
non nullo. Si dice allora che x è un punto regolare di f. Se x è regolare, f è local- 
mente equivalente all’applicazione identica Id : R*+R? ed è dunque in un cer- 
to senso localmente banale. L’«informazione » che caratterizza fenomenologica- 
mente f non può dunque provenire che dai punti in cui f non è un diffeomorfismo 
locale, cioè dai punti in cui la jacobiana nor è invertibile. Tali punti diconsi pun- 
ti singolari o punti critici di f. Si ritrova dunque, in un più largo contesto, l’idea 
di «configurazione critica ». Ma la struttura singolare di f può essere estrema- 
mente complicata e può percorrere tutti gli stadi che vanno dalle applicazioni 
massimamente singolari quali le funzioni costanti alle applicazioni ovunque rego- 
lari quali i diffeomorfismi globali del piano. La grande idea dovuta a Whitney è 


Punto d’increspatura 


DI 


Too Punto di piega 


: Cc UO, Pre Punto di cuspide 
UO PAS da 
unto di piega Cc 


a) 


Figura 10. 


I due modelli canonici del teorema di Whitney: a) piega, 5) increspatura. 
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allora quella di limitarsi alle applicazioni strutturalmente stabili e di dimostrare 
che il vincolo di stabilità è abbastanza forte per classificare le possibili singo- 
larità di f. 

TEOREMA DI WHITNEY. .Se f è un’applicazione differenziabile strutturalmente 
stabile del piano nel piano: 


a) il luogo critico di f (cioè l’insieme dei punti critici di f) è una curva regolare 
X (eventualmente vuota) di R*; 

b) l’immagine di X mediante f è una curva C di R? che ammette come sole sin- 
golarità possibili punti di regresso isolati ;; 

c) se x è un punto di X. la cui immagine f(x) appartiene a C— {;}, f è local- 
mente equivalente in x al modello canonico (x,, 2) > (x, x2); 

d) se x è un punto di 2 la cui immagine è uno dei ;, f è localmente equivalente 
in x al modello canonico (x,, x) > (x,,—x1%3+ 3). 


È abbastanza facile visualizzare i modelli canonici c) e d) di tale teorema. 
Basta «storcere » la sorgente R? (supposta immersa in R?) in modo che f diventi 
una proiezione. Nel primo caso si ottiene una catastrofe detta catastrofe piega 
e nel secondo una catastrofe detta catastrofe cuspide o catastrofe increspatura 
(fig. 10). 

Il contenuto e il valore del teorema di Whitney si chiariscono nell’ambito 
dei getti (cfr. l'articolo « Geometria e topologia », p. 684, in questa stessa Enciclo- 
pedia). L’idea fondamentale è allora che la stabilità di f s'esprime mediante pro- 
prietà di trasversalità (ibid., p. 683) delle immagini j*f(R?) rispetto a certi sotto- 
spazi degli spazi di getti 7*(R?, R?). 

Ciò che può essere battezzato «programma di Thom » consiste nel generaliz- 
zare l’analisi fin qui vista alle applicazioni differenziabili tra varietà arbitrarie e 
nel cercare modelli canonici per le singolarità stabili (generalizzazione dei punti 
c) e d) del teorema di Whitney). Gli strumenti algebrici fondamentali sono co- 
stituiti dal teorema di preparazione di Malgrange e dalla teoria della stabilità 
di Mather [tali argomenti si trovano esposti per esempio in Golubitsky e Guil- 
lemin 1973 e Poenaru 1974]. 


4.3. Genericità della stabilità. 


Dopo aver studiato certi criteri intrinseci di stabilità strutturale, è naturale 
domandarsi se tale proprietà soddisfa l'esigenza intuitiva secondo la quale ogni 
forma instabile può essere stabilizzata mediante piccole deformazioni. Si sa già 
che, per definizione, la stabilità strutturale è una proprietà aperta. Si tratta ora 
di sapere se è una proprietà densa. Questo problema è importante per il fatto 
che la non-densità può indicare dei limiti essenziali al concetto di stabilità. 

Questo problema è dominato da una parte da una proprietà topologica ge- 
nerale degli spazi funzionali che intervengono in questo tipo di riflessione, pro- 
prietà secondo la quale un’intersezione numerabile di aperti densi è un sotto- 
insieme denso (detto residuale) e dall’altra dal teorema di trasversalità di Thom, 
secondo cui generalmente le proprietà di trasversalità sono generiche (se si chia- 
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ma generica una proprietà soddisfatta su un insieme residuale) (cfr. il citato arti- 
colo « Geometria e topologia», p. 685). 

Ecco due estreme conseguenze di questo fondamentale teorema. Si consideri 
dapprima il caso di applicazioni differenziabili f : M+R. Sia n la dimensione 
di M e (x,, x», ..., xy) un sistema di coordinate locali in xe M. Sia x un punto 
critico, cioè df/dx,=...= òf/dx,=0 in x (tale proprietà è intrinseca, ossia non 
dipende dal sistema di coordinate scelto). Si consideri la matrice simmetrica 
delle derivate seconde di f in x, detta hessiana di f in x, 


df 
H(x={|_-T—-T(a)]. 
(io 
Si dice che x è un punto critico non degenere di f se H(x) ha rango mas- 
simo 2. 
TEOREMA. Genericamente i punti critici di un’applicazione f : M+R sono non 


degeneri ed isolati. 


Dimostrazione: Localmente 7'(14, R) ha coordinate (x, ..., x) per M, y 
per R e (&,, ..., é,) per la fibra. Sia S, il sottospazio di #1(M, R) degli 1-getti 
(1, +...) Xn Y, O; +++, 0), x è punto critico se e solo se j! f(x)e Si. 


LEMMA. x è non degenere se e solo se j!f è trasverso în x ad S,. 


Dimostrazione: j!f è l'applicazione (differenziabile) che associa al punto 
(x, ..., %n) di M il punto 


(i seg Any f(£), Li) 3%) o) 


di 7'(4, R). La sua jacobiana in x è dunque la matrice a 2n+1 righe ed x co- 
lonne: 


I Osa 0 
o) Ù; Genhl .6 
o) o I 
LA CA 
F= Òx, dx, 
SS f 
dx dx, dx, 
d°f èf 


il 
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Se u= (u,, ..., 4) è un vettore tangente ad /M in x, la sua immagine mediante 
l'applicazione tangente a j1f è dunque il vettore di coordinate: 
òf òf  d°f Òf ò?f df )- 
(ui sigg ET ge PL SSRE VEE Un; eva VIRA 
df df 
= (tut LET Hu 


Se x è critico, dire che j1f è trasverso in x ad S, significa che si possono ottenere 
in tal modo tutti i vettori (x, 0, w). Ma ciò significa precisamente che l’equa- 
zione Hu=%w è risolubile per ogni vettore w e dunque che 77 è invertibile, 0s- 
sia di rango massimo in x. 

Dato questo lemma, la prima parte del teorema è una conseguenza diretta 
del teorema di trasversalità. Quanto alla seconda, essa discende dal fatto che 
poiché Ss, ha codimensione x, se jif è trasversa ad (SÌ, j1f-1(.5,) è anche di co- 
dimensione 7 e dunque di dimensione o. 

Osservazione: Se x è un punto critico di f, f(x) dicesi valore critico di 
f. Si fa vedere con metodi analoghi che genericamente i valori critici sono di- 
stinti. 

Si consideri ora il caso delle applicazioni differenziabili f : M+N ove N, 
invece di essere di dimensione piccola come R, è di dimensione «grande » ri- 
spetto a quella di M. Si può sperare che esisteranno sufficienti gradi di libertà 
affinché: a) f diventi genericamente un’immersione, ossia che in ogni punto di 
M l'applicazione tangente di f sia iniettiva (questa è una nozione locale); 
b) f diventi un’immersione iniettiva, od anche un’immersione regolare (em- 
bedding) (questa è una nozione globale). 

Tale è ad esempio il contenuto del seguente teorema di Whitney che può es- 
sere ottenuto come corollario del teorema di trasversalità: 


TEOREMA DI IMMERSIONE (Whitney). Se dim N=2 dim M, le applicazioni 
differenziabili di M in N sono genericamente delle immersioni. 


Analogamente si dimostra che se dim N=2 dim M+ 1 le applicazioni dif- 
ferenziabili f : M-+.N sono genericamente immersioni iniettive. Ciò non vuol 
dire tuttavia che f sia un’immersione regolare poiché l’immagine f(M) di M me- 
diante f può essere talmente «ripiegata » su se stessa in N che la topologia in- 
dotta su f(M) da quella di N può non essere omeomorfa a quella di MM. Si può 
però dimostrare che se f è un’immersione iniettiva propria (cioè se l’immagine 
inversa mediante f di ogni compatto di N è un compatto di M), allora f è neces- 
sariamente un’immersione regolare. Se esistono dunque delle applicazioni pro- 
prie di M in N, il teorema di Whitney garantisce l’esistenza di immersioni re- 
golari di M in N. 

Ecco infine il risultato, completo e notevole, sulla densità delle applicazioni 
stabili. 
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TEOREMA DI MATHER. Le applicazioni strutturalmente stabili di una varietà 
di dimensione n in una varietà di dimensione p sono dense se e solo se 


a) p=n+4 e p<7(p_n)+8 
bbo<p-n<3 e p<7(p_n)+9 
c) p=n—1 e p<z8 

d)p=n-—-2 e p<6 

e) p<zn—-3 e P<7. 


In particolare per p=1 (caso f : M+R), r=2 e p=2 (caso f: R°?+R?), 
p=21 (caso delle immersioni) le applicazioni strutturalmente stabili sono dense. 

Osservazione: Se s’indebolisce il tipo differenziabile nel tipo topologico, al- 
lora la stabilità strutturale è sempre una proprietà generica. 


4.4. Geometria discriminante. e catastrofi elementari. 


Si vedrà ora in che modo viene affrontato, nel quadro del paradigma cata- 
strofista, il problema dell’instabilità. S'è visto che l’insieme di biforcazione glo- 
bale K dello spazio $ «geometrizza» la tassonomia delle forme stabili. Il pro- 
blema è dunque di analizzare, almeno localmente e se possibile globalmente, 
tali geometrie discriminanti. 

Sia dunque fe K una forma instabile. Bisogna descrivere la geometria di K 
nell'intorno di f. La situazione «ideale » sarebbe la seguente: 


a) La classe d’equivalenza G(f) di f è una «sottovarietà» (in generale di di- 
mensione infinita) di $ di codimensione finita (detta codimensione di f). 

b) Esistono localmente dei supplementari W di G(f), ossia delle sottova- 
rietà di dimensione uguale alla codimensione di f e trasverse a G(f) in 
f (si avrà dunque G(f)NW= {f}). Tali supplementari si diranno sezio- 
ni trasverse. 

c) La geometria della traccia di K su W, cioè la geometria della coppia 
(W, Kyw=WNK) resta invariante allorché W varia nell'insieme delle 
sezioni trasverse. (W7, K,y) si dirà modello trasverso di centro organizza- 
tore f. 


d) Localmente K è il prodotto diretto dell’orbita G(f) e di Ky (fig. 11). 


In generale la situazione è molto più complicata e la sua analisi si rivela gran- 
demente difficile. Ma nel caso delle applicazioni f : M+R di codimensione pic- 
cola si sono potuti dimostrare i punti a)-d). La cosa più difficile è dimostrare 
il punto c), nella misura in cui ci si pone nel campo reale ove a priori potrebbe 
succedere che, quando W varia, certe parti di Kyy diventino immaginarie. Il teo- 
rema di preparazione di Malgrange già citato è essenziale per la dimostrazione. 

I modelli trasversi di funzioni reali di codimensione inferiore o uguale a 4 
sono stati chiamati da Thom catastrofi elementari (cfr. l’articolo «Catastrofi » 
in questa stessa Enciclopedia). Eccone un esempio. 

Sia f : M+R una funzione instabile. Si può mostrare che esistono due cau- 


i 
i 
i 


Figura 11. 
Struttura locale ideale di K nell’intorno d’una forma instabile di codimensione finita. 


G 
G) 
Figura 12. 
Grafico di f(x)=x5. 
Nessuna radice reale Due radici reali Quattro radici reali 


Figura 13. 
Tipi fondamentali di funzioni stabilizzate di f(x)=x?. 


Figura 14. 
Modello trasverso della singolarità x%, detta coda di rondine. 
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se essenziali d’instabilità per le funzioni: 1) alcuni punti critici sono degeneri; 
2) alcuni valori critici sono uguali. 

È allora possibile rendere f stabile mediante piccole deformazioni: 4) facen- 
do «esplodere » i suoi punti critici degeneri in tanti punti critici non degeneri 
che li rigenerano per «collasso » o per «implosione »; 5) separando i valori critici. 

Si ottiene cosi un insieme finito di stabilizzazioni distinte di f utilizzando 
funzioni instabili intermedie. Tali successivi gradi di stabilizzazione possono 
essere «letti » direttamente sulla geometria di un modello trasverso di K in f, sot- 
to forma di una stratificazione. 

Si consideri per esempio l’applicazione instabile f : R+R data da f(x)= 5. 
Essa ammette l’origine come unico punto critico degenere. Il suo grafico C, è 
una curva di R? che ammette nell’origine un punto di flesso « appiattito » (fig. 12). 
La derivata di f vale 5x* e diventa, per piccole perturbazioni, un’equazione ge- 
nerale di quarto grado che può genericamente possedere quattro radici comples- 
se a due a due coniugate, due radici complesse coniugate e due radici reali di- 
stinte, oppure ancora quattro radici reali distinte. Questi tre casi corrispondono 
ai tre tipi fondamentali di funzioni stabilizzate di f presentati nella figura 13. 

Poiché f non può più diventare singolare per piccole deformazioni (infatti 
la proprietà di stabilità è una proprietà aperta e per questo il processo di stabi- 
lizzazione è irreversibile), è ovvio che ogni intorno sufficientemente piccolo di 
f è costituito da funzioni stabilizzate e da funzioni di transizione parzialmente 
stabilizzate (tab. 1) ove gli m; (rispettivamente gli 14;) indicano i minimi (rispet- 
tivamente i massimi) non degeneri. 

Fin qui si tratta soltanto di tassonomia (lista di casi). Bisogna ora vedere co- 
me la morfologia discriminante K permette di geometrizzare tale tassonomia. La 
singolarità x5 è una catastrofe elementare; perciò i punti a) e d) (p. 463) sono 
validi e basta dunque considerare un modello trasverso (W, Ky) (fig. 14). Si 
può dimostrare che x5 è una singolarità di codimensione 3. 

La sezione trasversa W ha dunque dimensione 3. Ky geometrizza la tasso- 
nomia nella misura in cui: 


a) Ky è una superficie che decompone W in sette cellule aperte disgiunte 
corrispondenti ai sette tipi di funzioni stabilizzate di f; 

b) i gradi d’instabilità intermedi possono essere «letti » sulla stratificazione 
di Ky che rende fenomenologica la decomposizione di Ky in orbite sotto 
l’azione di G. Più precisamente Ky si compone di strati di dimensione 2 
(ossia di codimensione 1) in corrispondenza alle instabilità di codimen- 
sione 1 che garantiscono le transizioni 1-2,, 1-29, 21-3, 22-3; 3-4, 4-5, 4-6, 
5-2, 6-2, 5-7, 6-7, 7-2. Questi strati si incollano lungo strati di dimen- 
sione I (cioè di codimensione 2) corrispondenti alle instabilità di codi- 
mensione 2 che garantiscono le transizioni 1-2-23-3, 21-3-4-5, 2273-46, 
4-5-6-7, 2-5-7, 2-6-7. Infine tali strati si incollano nel punto f, centro 
organizzatore della morfologia; 

c) la morfologia Ky è invariante quando si contrae W. Dal punto di vista 
topologico si tratta di una morfologia tipo «cono » di vertice f. 
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Tabella 1, 


Funzioni stabilizzate e parzialmente stabilizzate di transizione. 


Hi 


D 


ST 


Di 


2g. 


3-4. 


Fiale 
3S 


è 


B 
SS 


Nessun punto critico. 


Un massimo e un minimo. 
Vi sono due possibilità: 


Flesso semplice. Transizio- 
ne tra I e 2. Vi sono due pos- 
sibilità (1-2, e 1-29) a secon- 
da che collassi la coppia m}, 
M,, oppure la #,, M.. 


Due minimi e due massimi. 
Tale caso, di complessità 
massimale, è unico. Si sup- 
porrà ch’esso corrisponda al- 
l'ordine: 


Transizione tra 3 e 2. Vi so- 
no due possibilità: 


Per collasso di m, ed M,. 


Per collasso di m ed M,. 


mo<m<My<M,. 


my<my= My<M,. 


mimo <My<M,. 


f my=tt9<My<M,. 


vi 
d 
bi 
3 


Fai 


1-2-23-3. 


2173-45. 


233-426. 


4-5-6-7. 


2-5-7. 


2-6-7. 


È 
ia OS 


sd» 
S 


SS 


ai 
DI 


è 


Hi 
di 


HS 
SS 


Ds 
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Per collasso di m, ed M,. 


mo <m<My,<Mp. 


my<m<My< Ma. 


Per collasso di m, ed M,. 


my<my<M,< Ma. 


Per collasso di m, ed M,. 


my<my<M,= My. 


my=m,<M,<M,. 


Due punti di flesso. 
Un punto di flesso all’altezza 
di m, (becco). 


Un punto di flesso all’altezza 
di My. 


mj=m,<M,=M,. 


Collasso di Mi, #1 e M, (cu- 
spide duale). 


Collasso di #,, M, ed m; 
(cuspide). 


one 
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Osservazione: È chiaro in che cosa la stratificazione di K —- che, si ricordi, 
coincide in questo caso con la decomposizione di K in G-orbite — è fenomeno- 
logica: per disegnare Ky «occorre e basta» disegnare la sua stratificazione, le 
linee di autointersezione e i suoi spigoli di regresso. Benché in apparenza ano- 
dina, questa osservazione ha una grossa portata filosofica poiché mette in luce 
il fatto che le morfologie discriminanti che geometrizzano le tassonomie evi- 
denziano un'intuizione originaria. Inoltre, per l’ipotesi ontologica della teoria 
delle catastrofi questa intuizione originaria viene ad essere donatrice di signi- 
ficato. 

Il modo con cui Ky geometrizza la tassonomia dei successivi stabilizzati di 
f è rappresentato nella figura 15, che va attentamente esaminata. 


4.5. Dispiegamento universale. 


In ciò che precede W è una sezione trasversa, in 3, dell’orbita G(f) di f. 
D'altronde, poiché W è una sottovarietà di F di dimensione n=codim f, essa 
è diffeomorfa ad un intorno U dell’origine di R”, grazie ad un diffeomorfismo 
o: U+W. Siano allora «= (w,, ..., vu) le coordinate di U e (g,, ...,2n) le im- 
magini mediante g dei vettori unitari di U (si può supporre che U contenga la 
sfera unitaria di R*). Ogni funzione g di W si scrive g=f+wu1g1+...+ungn=fu 
W si può dunque interpretare come una famiglia f, di funzioni parametrizzate 
da U. In generale si chiama dispiegamento di f ogni famiglia f, parametrizzata 
da uno spazio di controllo (7, 0) tale che fa=f. Il dispiegamento ora conside- 
rato e che «esternalizza » in qualche modo la struttura di F nell’intorno di f è 
in una certa misura il «miglior» dispiegamento di f, poiché permette di rico- 
struire tutti gli altri. 


TEOREMA. Ogni dispiegamento f, di f si può ottenere come immagine reciproca 
di f,, mediante un’applicazione © : T+U unica al prim'ordine. 


fi prende il nome di dispiegamento universale di f, proprio perché risolve il 
precedente problema universale. 

Un problema tecnico e difficile è allora quello di trovare un modello cano- 
nico di dispiegamento universale sul quale sia possibile far calcoli. Nel caso 
della singolarità x* si dimostra che un modello canonico è f, = x°+u1x*+usx° + 
+u3x. Ciò permette di costruire Ky con facilità. 

L’esistenza di dispiegamenti universali permette d’altra parte di mostrare 
che la teoria della stabilità delle applicazioni f : M+R è indissociabile da quella 
delle applicazioni f : M-+N. Dire infatti che f,, è un dispiegamento universale 
di f equivale a dire che l’applicazione F: Mx U+RXxU, che porta (x, u) in 
(Su(x), x), è la più semplice applicazione di questo tipo che sia strutturalmente 
stabile. 
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Figura 15. 


Geometrizzazione della tassonomia delle successive funzioni stabilizzate di f(x)=x9. 
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4.6. La dialettica locale/globale nei dispiegamenti. 


I dispiegamenti delle singolarità forniscono un nuovo paradigma di dialettica 
tra il locale e il globale. La nozione di stabilizzazione (parziale o totale) intro- 
duce una relazione di preordine o di incidenza tra singolarità. L’asimmetria 
di questa relazione, esprimente in qualche modo l’irreversibilità dei processi di 
stabilizzazione, può sembrare un po’ paradossale. Essa discende dal fatto che 
la proprietà di stabilità è aperta. Se dunque per « esplosione » di un punto critico 
o per separazione di valori critici di f si stabilizza f in f, per deformazione in- 
finitesimale, non si può «tornare » da f, ad f che per deformazione finita. Me- 
diante deformazioni infinitesimali si può soltanto, una volta raggiunta f,, otte- 
nere di nuovo f,, poiché f, è stabile. 

La dialettica locale/globale inerente al concetto di dispiegamento si esprime 
allora col fatto che un modello trasverso ad una singolarità contiene modelli tra- 
sversi di tutte le singolarità incidenti a questa. Si consideri per esempio un pun- 
to di transizione g del tipo 2-7:\7-7) nel caso f(x)= x. £ possiede come sola in- 
stabilità un punto di piega, ossia un punto di flesso semplice. Orbene, un punto 
di flesso semplice ammette come modello trasverso il modello unidimensionale 
della figura 16. Ma una qualunque sezione trasversa a Kyy in g (cioè ogni arco 
trasverso in g allo strato di g) fornisce un tale modello (fig. 17). 

Si consideri analogamente un punto % del tipo 2-6-7. % possiede come unica 
instabilità una cuspide; essa ammette come modello trasverso il modello bidi- 
mensionale della figura 18. Ma un tale modello è fornito da una qualsiasi se- 
zione trasversa a Ky in À (cioè una qualsiasi sezione piana trasversa in 4 allo 
strato unidimensionale di 4) (fig. 19). 

Un modello trasverso (W, K,y) di f s’interpreta dunque come un incolla- 
mento di modelli trasversi delle singolarità incidenti ad f. Come dispiegamento 
del centro organizzatore f, (W, Ky) è una entità locale. Come incollamento di 
dispiegamenti più semplici, (W, Ky) è invece un'entità globale. Se tale mo- 
dello venisse rappresentato, secondo quanto proposto da Zeeman, come una 
«parola » (globale) composta di «lettere » (locale), si concluderebbe che in tale 
curioso alfabeto ciò che è «parola » composta è indistinguibilmente «lettera » ir- 
riducibile. La dialettica locale/globale, associata al concetto di dispiegamento, 


Figura 16. 


Dispiegamento universale d’un punto di flesso semplice. 


16 
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Figura 17. 
Ogni sezione trasversa di Ky in g è un modello trasverso di g. 


Figura 18. 
Dispiegamento universale di una cuspide. 


Kr 


Figura 19. 
Una qualsiasi sezione trasversa di Kyy in 4 è un modello trasverso di &. 
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fornisce dunque un paradigma in cui la nozione classica di livelli gerarchici e 
le opposizioni presunte universali semplice/complesso, composto/irriducibile, 
locale/globale, atomo/ammasso, componente/sistema, ecc. diventano non per- 
tinenti. Infatti questo paradigma geometrizza in una certa misura quello della 
monadologia leibniziana. 


5. La teoria di Morse come passaggio dal locale al globale. 


Dopo aver indicato alcuni aspetti del paradigma catastrofista, si riprende ora 
la sua idea centrale, ossia che, nel caso differenziabile, il vincolo di stabilità 
strutturale permette di ripassare dal locale al globale, ma con modalità tutta di- 
versa da quella del prolungamento analitico. Il caso più chiaro e più tipico a 
tal riguardo è fornito dalla teoria di Morse e dalle sue applicazioni. 


5.1. Funzioni di Morse e presentazioni per anse. 


Si è visto che le applicazioni differenziabili f : M+R sono genericamente 
quelle 4) che ammettono solo punti critici non degeneri isolati; è) che possiedo- 
no valori critici tutti distinti. Tali funzioni si chiamano funzioni di Morse (su 
M). Se ci si limita a considerare varietà IM compatte al fine di evitare le insta- 
bilità dovute all'eventuale accumularsi dei punti critici all'infinito, si può dimo- 
strare che le proprietà a) e d) sono caratteristiche della stabilità strutturale. 


TEOREMA. Sta M una varietà compatta. f: M+R è strutturalmente stabile 
se e solo se è una funzione di Morse. Essa ammette allora un numero finito di punti 
critici non degeneri aventi valori critici tutti distinti. 


Su di una varietà compatta esistono dunque due sole cause d’instabilità per 
le funzioni: il degenerare di punti critici e il coincidere di valori critici. La prima 
dà origine per dispiegamento alle catastrofi dette di biforcazione e la seconda al- 
le catastrofi dette di conflitto. 

Si vedrà ora che le funzioni di Morse sono intimamente legate alla struttura 
globale della varietà M. Siano f una funzione di Morse su 2 (di dimensione n) 
ed xe M un punto critico di f. Poiché x per definizione è non degenere, lo svi- 
luppo di Taylor 7,(f) di f in x inizia (dopo il termine costante f(x)) con la for- 
ma bilineare non degenere e simmetrica 


2 
Wuh= Y (hh; 


i,j=1 Òx; dx; 


ove X= (ki, ..., h) è un incremento di x e H l’hessiana di f in x. Per un risultato 
classico di algebra lineare una forma bilineare simmetrica non degenere è dia- 
gonalizzabile. Mediante un cambiamento lineare di coordinate si può dunque 
scrivere 7,(f) sotto la forma 7,,(f)=f(x)— (#î+...+4$)+4î1+..+4%+termi- 
ni del terzo ordine. Il numero & di quadrati preceduti dal segno — non dipende 
dal sistema di coordinate scelto e si chiama indice del punto critico. 
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Ma si può invero andare molto più lontano nell’analisi della struttura locale di 
f nell’intorno di un punto critico non degenere. Un famoso teorema di Morse 
afferma infatti che i punti critici non degeneri sono determinati dell'ordine 2. 


TEOREMA (Morse). Sia xe M un punto critico non degenere d’indice k di 
f: MR. Esistono in M coordinate locali tali che f si può scrivere nell’intorno di 
x nella forma canonica: f(x+h)=f(x)-(M+...+hf) +hî1t+hî. 


Sono dunque disponibili modelli locali canonici per i punti critici di una 
funzione di Morse. Si tratta di vertici (indice n), oppure di bacini (indice 0), 
oppure di colli. Inoltre M può essere rappresentata nella forma di un « incolla- 
mento » di tali modelli. Uno degli aspetti più manifesti del nuovo tipo di soli 
darietà tra locale e globale già definito è che se r.(k) è il numero di punti critici 

n 


d’indice & di f, la somma alternata )°(--1)fx(k) è uguale alla caratteristica 
X 


d’Eulero-Poincaré y(M) di M (cfr. l'articolo citato «Geometria e topologia »). 
Orbene, y(M), che è l’invariante globale fondamentale di M, non dipende da É 
Ancora una volta si constata che l’omologia del substrato influisce sulle entità 
derivate di tale substrato (in questo caso, sulle funzioni differenziabili a condi- 
zione che queste siano strutturalmente stabili). 

Uno degli aspetti più interessanti della solidarietà locale/globale caratteri- 
stica delle funzioni di Morse è nella possibilità di ricostruire topologicamente la 
varietà substrato M per successivi incollamenti di anse associate ai punti cri- 
tici della funzione. L'analisi di tali presentazioni mediante anse e delle loro de- 
formazioni è quindi equivalente a quella dei cammini nello spazio 3 delle ap- 
plicazioni differenziabili f : M-+R decomposto in cellule dall'insieme cata- 
strofico globale X (il cui complementare F, è proprio l'insieme delle funzioni di 
Morse). Genericamente, tali cammini attraversano trasversalmente gli strati K, 
di codimensione 1 in un numero finito di punti e genericamente deformando 
tali cammini si attraversano al più gli strati XK, di codimensione 2 di K. Lo 
studio dettagliato di tali attraversamenti è all'origine di alcuni fra i più signi- 
ficativi ed interessanti risultati della topologia differenziale moderna: ad esem- 
pio il teorema di 4-cobordismo di Smale e il teorema di pseudo-isotopia di 
Cerf (e le loro estensioni dovute a Laudenbach e Chanciner [cfr. Hatcher e 
Wagoner 1973]) che costituiscono delle tappe decisive per la dimostrazione della 
congettura di Poincaré (cfr. il $ 13 dell'articolo «Invariante» in questa stessa 
Enciclopedia). 


6. Strutture localmente triviali. 


Nelle tre sezioni precedenti si è fornito uno schema dei due casi tipici ed 
eterogenei di passaggio dal locale al globale riguardanti le funzioni. Nei due ca- 
si si è constatato che la dialettica locale/globale era indissociabile dal modo in 
cui il substrato delle applicazioni era esso stesso definito come incollamento di 
modelli locali. In questa sezione verrà un poco approfondita la nozione di in- 
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collamento ed introdotto il «linguaggio » della transizione dal locale al globale 
costituito dal linguaggio coomologico. Nella misura in cui le entità globali prese 
in esame saranno localmente equivalenti ad entità locali standard, esse saranno 
dette localmente triviali. 


6.1. Varietà differenziabili e livelli di struttura. 


Fin da quando fu intuitivamente introdotta da Riemann, la nozione di varie- 
tà conteneva due idee chiave che sovvertirono totalmente l’intuizione spaziale 
classica: 


1) si possono localizzare le geometrie standard di R” e di C” e riglobalizzarle 
in modo non standard; 

2) si possono trattare come «punti» entità che non sono punti geometrici. 
A tal fine basta che queste entità ammettano gradi di libertà interni che 
possano variare come punti geometrici. 


Tali idee rese esplicite da Hermann Weyl nel caso delle superfici di Riemann 
(varietà olomorfe di dimensione 1) sono alla base del concetto di varietà, già 
presentato negli articoli « Applicazioni », « Curve e superfici », « Geometria e to- 
pologia » di questa stessa Enciclopedia. 

Per tener conto dell’idea chiave 2) si parte da uno spazio topologico M local- 
mente omeomorfo ad uno spazio standard R”. 'Tale spazio dicesi varietà topo- 
logica di dimensione n. Per definire strutture più «rigide» su MM (differenziabi- 
li, analitiche, algebriche) si osserva che M, essendo localmente omeomorfa ad 
R”, si ottiene incollando degli aperti U;, detti carte locali, omeomorfi ad aperti 
Ui di R”, tramite omeomorfismi di incollamento (o di transizione), tutti tra loro 
coerenti, detti cambiamenti di carte locali. L’idea è allora d’imporre condizioni 
supplementari a tali omeomorfismi di transizione. Cosî, rafforzando successi- 
vamente le condizioni imposte ai cambiamenti di carte locali, ne deriva una ge- 
rarchia di livelli di struttura il cui livello base è quello topologico. Questo sem- 
plice punto di vista orienta la teoria verso una serie di importantissimi problemi 
il cui studio ha costituito uno dei principali motori della matematica di questo 
secolo. 

Il primo problema è quello della classificazione delle varietà. Si tratta di « mi- 
surare » quello che separa globalmente una varietà da uno spazio standard. L’esi- 
stenza di una gerarchia di livelli conduce a domandarsi dapprima quale sia il 
livello zero (classificazione topologica delle varietà: cfr. l'articolo «Geometria e 
topologia », pp. 660-72). 

Una volta chiariti certi strumenti che permettono di abbordare la struttura 
del livello topologico, il problema della classificazione sbocca naturalmente nella 
seguente strategia: data una varietà munita d’una struttura d’un certo livello, si 
cerca di capire in che modo tale struttura vincoli i livelli superiori. Si può ad 
esempio partire da una varietà topologica M e cercare di classificare le strutture 
differenziabili su M che inducono la sua topologia. Questo difficile problema ha 
assunto una notevole importanza a partire dai lavori di Kervaire e Milnor sulla 


Locale/globale 474 


struttura differenziabile delle sfere (teoria delle sfere esotiche): su certe sfere to- 
pologiche esistono strutture differenziabili diverse dalla struttura standard. 

Inoltre, il problema della classificazione di tali strutture è in gran parte al- 
gebrizzabile. 

Si può anche partire da una varietà differenziabile di dimensione pari e cer- 
care di classificare le strutture olomorfe compatibili con la sua struttura diffe- 
renziabile. Ad esempio s’è visto che le curve ellittiche (superfici di Riemann 
compatte di genere 1) sono tori, ossia quozienti di R? mediante reticoli. Tutti i 
tori sono diffeomorfi, ma le curve ellittiche sono classificate mediante un inva- 
riante unidimensionale detto invariante modulare per cui si rimanda al citato 
articolo «Curve e superfici ». 

Un altro tipo di problema indotto dalla definizione stessa di varietà è quello 
di sapere in che misura un oggetto ottenuto per incollamento di modelli locali 
è identificabile a un sotto-oggetto d’un oggetto standard globale. Si tratta del 
problema delle immersioni regolari e più in generale delle immersioni. In tale 
ambito particolarmente importanti sono i teoremi di tipo Whitney visti al 
$ 4.3, i problemi della teoria dei nodi (immersioni regolari di M= S! in R?) e 
quello del rovesciamento della sfera S? in R?. 


6.2. Fibrazioni localmente triviali. 


Il caso forse più importante di strutture localmente triviali è costituito dalle 
fibrazioni localmente triviali la cui nozione è stata sviluppata negli anni ’30 nei 
lavori pionieristici di Whitney, Hopf e Stiefel. Molto spesso, per risolvere un 
problema o anche soltanto per porlo, si è condotti, data una varietà di base di 
tipo x (differenziabile, analitica, algebrica, ecc.), ad associare ad ogni punto 
xe M un'entità F, che varia in modo 7 in funzione di x. Si dice allora che F, 
è la fibra al di sopra di x e che l’insieme E delle fibre F, costituisce una fibrazio- 
ne (di base M), n: E+M, di fibra nr1(x)=Z,. 

Molto frequentemente la variazione di F, in funzione di x è tale che in un 
intorno abbastanza piccolo U di x, E ristretto ad U possiede la struttura di un 
prodotto diretto U x F di U per una fibra tipo F, ove la fibrazione s’identifica 
localmente alla fibrazione, detta triviale, x : Ux F+U essendo x la proiezione 
canonica. Si dice in tal caso che la fibrazione x : E+ M è localmente triviale 
(1.t.). 7 si ottiene dunque per incollamento di modelli locali U x F. Se M è con- 
nessa, tutte le fibre F,, sono t-isomorfe alla fibra tipo F e ciò che caratterizza x 
è dunque il modo con cui essa si discosta dalla fibrazione globalmente triviale 
M x F+ M. Ecco allora che si tratterà di elaborare un linguaggio generale atto 
a «misurare » questo scarto. 

Per fare ciò verranno ora introdotte due idee intuitive. Sia y : 4+ò un cam- 
mino sulla base M. Si parte dalla fibra F, e si segue la sua t-variazione lungo y 
fino alla fibra F,. Se y è un cappio (a=b) si ritorna su F,. Intuitivamente la 
fibrazione ristretta al «cerchio » y non è triviale in quanto Y, tornerà su se stessa, 
ma «ruotata »: F, torna globalmente in sé, in generale però non vi torna local- 
mente. Essa vi ritorna tramite uno dei suoi automorfismi. Per analizzare le fibra- 
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zioni di fibra tipo F bisogna dunque anzitutto definire il gruppo G degli auto- 
morfismi ammissibili di F. D'altra parte se y è un cappio omotopicamente od 
omologicamente triviale, sembra intuitivo che la fibrazione ristretta a y deve 
potersi deformare nella fibrazione triviale F, {a} e dovrà dunque essere glo- 
balmente triviale. Ci si aspetta perciò che la non-trivialità di x : E+.M provenga 
da un delicato collegamento tra la struttura del gruppo G e l’omotopia o l’omo- 
logia di M. In tal senso le fibrazioni l.t. integrano l’essenziale delle applicazio- 
ni della topologia algebrica allo studio delle proprietà globali delle varietà. Que- 
sta integrazione può del resto essere interpretata come una generalizzazione 
dell’analisi delle applicazioni di una varietà in un’altra. Sia infatti f: M+N 
una tale applicazione. Il suo grafico C; è una sezione della fibrazione triviale 
t:MxN+M, vale a dire un’applicazione C; : M+M x N che manda x in (x, 
f(x)), tale che 70 C;=Idy. Le sezioni globali di una qualsiasi fibrazione l.t. 
n: E+M, ossia le applicazioni 0: M+ E tali che 700=1dy, possono dunque 
essere interpretate come applicazioni generalizzate. Uno dei problemi fonda- 
mentali della teoria delle fibrazioni l.t. concerne la costruzione di sezioni globali 
(quelle locali esistono per definizione). 

Si consideri per esempio una varietà differenziabile // di dimensione n. 
Lo spazio tangente 7, di M in x varia differenziabilmente con x e definisce una 
fibrazione Lt. rr: Ty>M detta fibrato tangente a M. Una sezione di 7 è sem- 
plicemente un campo di vettori differenziabile su M. Se 7y, fosse un fibrato 
triviale si potrebbero costruire dei campi «costanti» su M. Ma ciò non avviene 
in generale. Si sa infatti che esistono varietà come la sfera 5? sulle quali ogni 
campo di vettori s'annulla necessariamente in certi punti (detti punti singolari). 
Ciò significa che ogni sezione di 7yy interseca la sezione nulla e che 7yy non è 
perciò globalmente triviale. Questa è una conseguenza di un teorema di soli- 
darietà locale/globale analogo a quello visto in teoria di Morse. Ad ogni punto 
singolare isolato di un campo X su M si può associare un numero chiamato il 
suo indice. Il teorema dice che se M è compatta e se tutti i punti singolari di X 
sono isolati (allora sono in numero finito), la somma degl’indici è uguale alla 
caratteristica di Eulero-Poincaré di M. 

Allorché il fibrato tangente Ty d’una varietà M è globalmente triviale, si 
dice che M è parallelizzabile. Ciò significa che si possono trovare n sezioni 
Xi, ++, X, di Ty globalmente linearmente indipendenti, cioè tali che (X, (x), 
«1, X,(«)) sia una base di 7, per ogni.xe M. In altri termini si può spostare dif- 
ferenziabilmente un riferimento di 77. La ricerca di criteri che assicurino che 
MM sia parallelizzabile è un problema difficile, interamente risolto nel caso delle 
sfere da Frank Adams [1962]. 


TEOREMA. Le sole sfere parallelizzabili sono S*, S3 ed Sî. 


Tale risultato profondo e notevole è intimamente legato all’esistenza delle 
fibrazioni di Hopf delle sfere mediante sfere. Il suo corrispondente algebrico è 
il risultato che afferma che esiste struttura di corpo su R” solo quando n=2 
(numeri complessi), 1=4 (quaternioni) e r=8 (numeri di Cayley). Le sfere 
parallelizzabili sono le sfere unità di tali corpi. 
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Per precisare il concetto di fibrazione l.t. (differenziabile), si considerino 
uno spazio di base // che è una varietà differenziabile, uno spazio totale E, una 
proiezione x : E+M, una fibra tipo F e un gruppo G di diffeomorfismi di F. 
Sia U=(U;);er un sistema di carte locali di M che localmente trivializzano 
n : EM. Ciò significa, in primo luogo, che sono assegnati dei diffeomorfismi 
di trivializzazione ©; sugli U; che rendono commutativi i diagrammi: 


U;xF > n1(U)) 


U. 


v 


Per ogni xe U,, 4; definisce pertanto un diffeomorfismo di cambiamento di fibra 
Qig FSFE,=n (0). 

In secondo luogo, significa che i g; , soddisfano alla condizione d’incolla- 
mento «Se i, je/ sono tali che UN U;# W, allora per ogni xe UN U;, %jj(x)= 
= 710; ,:F-+Fè un elemento di G» (che varia in modo differenziabile con 
x se G è un gruppo differenziabile). 

È allora banale verificare che se î, j, &ReI sono tali che U;N UNU#0, 
9.9, € 94 sono legati dalla relazione fondamentale 8;;9,,9,;=1 (si noti che 
d,;=97). 

"Questa relazione permette di esprimere quanto precede in modo più con- 
cettuale, in termini che condurranno alla coomologia di Cech. Il ricoprimento 
aperto U=(U;);cy di M induce una struttura combinatoria K detta simpli- 
ciale sull’insieme / degl’indici. Gli o-simplessi sono gli elementi di I. Gli 1- 
simplessi le coppie (i, j) tali che U;NU;#@. I 2-simplessi le terne (i, j, &) 
tali che UN U;NU,#2, ecc. Si possono poi addizionare formalmente i sim- 
plessi. Il complesso simpliciale K viene detto scheletro del ricoprimento UL 
Esso esprime il modo con cui per M si pone il problema dell’incollamento: 
se M fosse uno spazio standard, U potrebbe ridursi a un unico elemento e K 
sarebbe allora triviale. L'altro dato del problema è il gruppo strutturale G. Per 
ogni aperto U di M si indichi con T'(U) l'insieme delle applicazioni (differen- 
ziabili se G lo è) è : U+G. Se de T'(U) e VCU, 8 induce per restrizione a V 
un elemento &|y di IT(V). Dicesi prefascio su M a valori in G un tale dato. 
Si tornerà su questo concetto al $ 7.1. Se s è un simplesso di K, ad esso si as- 
socia il gruppo T,=T(MU) ove NU è Pintersezione (non vuota) degli aperti 

8 8 
di U il cui indice appartiene ad s. Si definisce cosi quello che si chiama sistema 


di coefficienti che permette allora di definire naturalmente la nozione di co- 
catena. 


DEFINIZIONE. Una p-cocatena associa ad ogni p-simplesso s un elemento del 
gruppo T,. 


Una o-cocatena associa dunque ad ogni o-simplesso ie/ un’applicazione 
@; : U;+G. Una I-cocatena associa ad ogni 1-simplesso (î, j) di K un’applica- 
zione d;;: U(NU;>G. Una 2-cocatena associa ad ogni 2-simplesso (7, j, A) 
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di K un'applicazione Y; x: UN U;NU,-+G, ecc. Il maggiore interesse di tale 
costruzione è di mettere in evidenza l'operatore cobordo che associa a una )- 
catena una (9 +1)-cocatena detta il suo cobordo. Se ad esempio p=(,);e, è una 
o-cocatena, il suo cobordo dg è la 1-cocatena d che associa ad ogni 1-simples- 
so (1,7) di K l'applicazione 3;;= p7!; (G essendo un gruppo, si possono com- 
porre le applicazioni a valori in G). Analogamente, se 9 = (9,;) è una 1-cocatena, 
il suo cobordo d9 è la 2-cocatena Y che associa ad ogni 2-simplesso (i, j, k) di K 
l'applicazione d;;:=9,;3;3,. Se ® è anch’esso un cobordo, 9 = dp, allora 
09 = 97190790; = 1. Si ha dunque d?=1. 

Osservazione: Affinché ciò che precede sia naturale bisogna che il gruppo G 
sia commutativo. Si usa allora una notazione additiva e si ottiene d,= 
depp Via=d;+8+8,, e d=o. 

La relazione fondamentale ò*?=0, analoga a quella incontrata a proposito 
dell’omologia (cfr. il $ 4.3 dell’articolo citato « Geometria e topologia »), per- 
mette di definire i gruppi di coomologia H?(U, G) del ricoprimento U a coeffi- 
cienti in G. H?(U, G) è il quoziente del gruppo delle p-cocatene a cobordo nullo 
(dette p-cocicli) rispetto al sottogruppo delle p-cocatene che sono cobordi [per 
maggiori dettagli si veda il classico Godement 1964]. 

A parte le difficoltà dovute alla non-commutatività, si può affermare che 
dare una fibrazione l.t. è essenzialmente equivalente ad assegnare un 1-cociclo 
a coefficienti in G. Si ha in effetti il teorema: 


=D 


TEOREMA. Se d= (8;,) è un 1-cociclo a coefficienti in G, esiste, a meno di equi- 
valenze, uno ed un solo fibrato l.t., di fibra F e di gruppo G, le cui 9; sono le appli- 
cazioni d’incollamento. 


In tale descrizione la proprietà di trivialità globale si rivela essere d’ordine 
essenzialmente coomologico. 


TEOREMA. La fibrazione E è triviale se e solo se l’1-cociclo è un cobordo, cioè 
se e solo se esistono delle @; : U;>G tali che d,; = ip, 


Osservazione: L’1-cociclo 8 che definisce E ha sempre l’aspetto di un co- 
bordo poiché, per definizione, le è; sono della forma 9;!9;. Le 9; non sono pe- 
rò applicazioni di U, in G. Per xe U,, @;(x) non è un automorfismo di F ma un 
isomorfismo tra F ed F,; esattamente in ciò consiste tutta la differenza. 


La teoria delle fibrazioni I.t. si semplifica notevolmente quando ci si limita 
ai fibrati detti principali, ossia ai fibrati di fibra G e di gruppo strutturale G ope- 
rante su se stesso per traslazioni. Ad ogni fibrato l.t. si associa un fibrato prin- 
cipale definito dal medesimo 1-cociclo; inoltre, per quello che precede, un fibra- 
to l.t. è caratterizzato, a meno di equivalenze, dal suo fibrato principale associato 
e dall’azione del suo gruppo strutturale sulla fibra tipo. 

Se la teoria dei fibrati principali è relativamente semplice ciò è dovuto al fat- 
to che esiste un eriterio semplice di trivialità. 


TEOREMA. Un fibrato principale è triviale se e solo se ammette una sezione. 
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Tale risultato permette di capire il nesso tra il fatto che le sfere 51, 5° ed 
S° siano parallelizzabili e il fatto che esistano strutture di corpo su R?, R* ed RÎ. 


Si tratterà ora del linguaggio coomologico che è per eccellenza il linguaggio 
di transizione dal locale al globale nella misura in cui permette di misurarne 
l’ostruzione. 

Inizialmente si consideri il caso semplice in cui il gruppo strutturale G è 
discreto. Tal è in particolare il caso delle fibrazioni l.t. elementari che sono 1 ri- 
vestimenti non ramificati. Si supponga che la base M sia connessa per archi e 
sia Y : x7>x, un cammino y(t)=x,, te! di M. «Risalendo» nello spazio to- 
tale, si può seguire la fibra sopra y attraverso una famiglia d’isomorfismi 
hy : F,,3Fy Se G è discreto, il principio del rilevamento delle omotopie ga- 
rantisce che tale «traslazione » della fibra è unica e dipende soltanto dalla classe 
d’omotopia di y. Se in particolare y è un cappio, 44 : F,y,>Fx, è un elemento 
di G. Si definisce cosi un morfismo yy : t1(M)=G che dicesi la classe caratte- 
ristica di E. y è «caratteristica » nel senso seguente: 


TEOREMA. 1) Due fibrati aventi lo stesso gruppo discreto sono associati, ossia 
di ugual fibrato principale, se e solo se le loro classi caratteristiche sono uguali. 
2) Per ogni morfismo y : r,(M)-G esiste un fibrato principale E di gruppo G 
tale che xe=%. 


In tal caso la classificazione dei fibrati è ricondotta allo studio puramente 
algebrico dei morfismi y. 


coroLLARrIo. Se M è semplicemente connessa, ogni fibrato di gruppo G è 
triviale. 


Osservazione: Ciò mostra che l’ipotesi G discreto è essenziale. 5° è sempli- 
cemente connessa ma il suo fibrato tangente (avente gruppo strutturale il gruppo 
lineare non discreto GL (2)) è non triviale. 

Nel caso dei fibrati principali di gruppo qualsiasi, le classi caratteristiche si 
deducono in dimensione > 1 dalla successione esatta di omotopia. 

La nozione di classe caratteristica è l’inizio della teoria coomologica dei fibra- 
ti Lt., la quale misura l’ostruzione al passaggio dal locale al globale e in parti- 
colare l’ostruzione alla costruzione di una sezione globale. Si supponga che la 
base M di dimensione x sia assegnata sotto la forma di un complesso cellulare 
K, cioè triangolata da un numero finito di poliedri convessi pieni, di dimen- 
sione n. Per costruire una sezione globale di un fibrato l.t. 7 : E+M l’idea sarà 
di supporla data sulle p-facce di K e di cercare di prolungarla alle (9 +1)-facce. 
Si tratterà poi di misurare l’ostruzione ad una tale estensione. L’ostruzione al- 
l’estensione ad una cellula è descritta da un opportuno cociclo della fibra. La 
difficoltà proviene dal fatto che la coomologia della fibra, anche se sempre iso- 
morfa a quella della fibra tipo F, varia con la fibra. Si deve quindi considerare 
il fibrato Lt. che esprime tale variazione ed estendervi la teoria della coomologia 
(coomologia a valori in un fibrato di coefficienti). L’ostruzione alla costruzione 
di una sezione globale di x viene allora misurata da una classe di coomologia 
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in questo nuovo senso; si tratta di una classe che dipende solo da x e viene 
detta classe caratteristica di coomologia di E [cfr. Steenrod 1951]. 

i A partire dagli anni ’so il concetto di classe caratteristica è stato oggetto di 
sviluppi considerevoli e si è rivelato uno strumento essenziale alla compren- 
sione della dialettica locale/globale. 


6.3. Linguaggio categoriale dell’incollamento. 


Per concludere questo paragrafo sulle strutture localmente triviali si noti che 
la nozione di incollamento può tradursi in termini puramente categoriali. Una 
tale traduzione è interessante poiché permette di trasportare la nozione di in- 
collamento a situazioni in cui l’intuizione geometrica viene meno. 

Come sè visto, una varietà topologica è uno spazio topologico M munito di 
un ricoprimento aperto U=(U;);ez i cui aperti U; sono omeomorfi ad aperti 
di R”. Per definire poi le strutture di livello superiore su M s’impongono certi 
vincoli supplementari agli omeomorfismi di transizione. Dal punto di vista ca- 
tegoriale, ciò equivale a considerare la categoria Top degli spazi topologici e la 
categoria piccola M dei modelli locali i cui oggetti sono gli aperti di R” (o di 
C”) e i morfismi sono gli isomorfismi locali difterenziabili (o analitici). 

In generale, data una categoria ©, una categoria (piccola) di modelli locali 
M e un funtore inclusione I : M+C, si tratta di definire gli oggetti globali di 
€ ottenuti per incollamento di modelli locali. Tale costruzione [per una espo- 
sizione dettagliata della quale si veda Appelgate e Tierney 1966-67], oltre ad ave- 
re grande generalità, riconduce i problemi di incollamento all’analisi di strutture 
puramente categoriche associate all'esistenza di coppie di funtori aggiunti. 


7. Fasci e coomologia dei fasci. 


Nel paragrafo precedente ci si è occupati del passaggio dal locale al globale 
ottenuto per incollamento di spazi substrati. Ciò ha condotto al concetto di fibra- 
to localmente triviale e di sezione come anche al problema di prolungare le se- 
zioni. Prima ci si era interessati al passaggio dal locale al globale ottenuto per 
incollamento di funzioni. Esiste un intimo legame tra i due punti di vista. Si è 
visto, ad esempio, nel caso analitico, che il prolungamento analitico di una fun- 
zione olomorfa data localmente determinava il proprio spazio substrato. È dun- 
que augurabile disporre d’un linguaggio unitario e generale che sintetizzi i due 
fon di vista. Tale è il fine della teoria dei fasci di cui si daranno le definizioni 

i base. 


7.1. Fasci e spazi étalé. 


Nella teoria dei fasci il concetto primitivo è quello di «sezione ». L’idea è di 
definire in modo generale gli assiomi cui devono soddisfare certe entità affinché 
esse meritino il nome di sezioni; poi di costruire uno spazio «fibrato » (che non 
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sarà in generale un fibrato l.t. ) le cui sezioni si identifichino con le sezioni date. 

Per poter parlare di sezioni, bisogna dapprima disporre di uno spazio di ba- 
se IM che sia uno spazio topologico. Ad ogni aperto U di MM si associa un insieme 
di sezioni su U che verrà denotato T'(U). Il primo vincolo è allora che sia defi- 
nita la nozione di restrizione di una sezione. In altre parole se VC U è un sotto- 
aperto di U, bisogna poter associare ad ogni elemento fel'(U) un elemento 
f|yeT(V)e ciò in modo che a) f|y=f, b) se WCVcU, (finle=/lw (tran- 
sitività della restrizione). Questo vincolo si esprime molto facilmente in termini 
di categorie. Sia M la categoria piccola i cui oggetti sono gli aperti di M ed i 
morfismi le inclusioni di aperti. Affinché la nozione di restrizione sia definita, 
occorre e basta che i T'(U) costituiscano un funtore della categoria M* duale 
di M nella categoria & degli insiemi (cfr. il $ 2 dell’articolo «Dualità » in questa 
stessa Enciclopedia). Da cui la seguente definizione: 


DEFINIZIONE. St chiama prefascio su M un funtore controvariante di M in &. 


È chiaro che i prefasci formano una categoria, precisamente la categoria 
(M*, €) dei funtori di M* in &. 

Sia dunque T un prefascio su M. È chiaro che se I è il prefascio delle se- 
zioni di M in uno spazio totale E, esso soddisfa alle due seguenti proprietà: 


(F;) Sia (U;);e; una famiglia di aperti di M la cui unione è U e siano 
f, f'eT(U). Se le restrizioni di f ed f” agli U; sono uguali, allora f 
ed f’ sono uguali (se f=f' localmente, allora f=f' globalmente). 

(F.) Perognizel sia f;eT(U;). Se le f; sono compatibili, cioè coincidono 
sulle intersezioni U;N U; che sono non-vuote, allora esiste una se- 
zione fe T'(U) tale che f|y;=f; per ogni sel. 


DEFINIZIONE. Un prefascio su M è un fascio se esso soddisfa gli assiomi (F;) 
ed (Fo). 


Ora che si dispone d’una definizione assiomatica dei fasci, si tratta di sapere 
se ogni fascio astratto è rappresentabile come il fascio delle sezioni d’un «fi- 
brato» n: E+M. 

Sia Cy la categoria degli spazi topologici «al di sopra » di M, ossia la cate- 
goria i cui oggetti sono le applicazioni continue x : E+M ed i morfismi i dia- 
grammi commutativi 


ED PF 


N 0 
M 


Le inclusioni UCM definiscono banalmente una inclusione /: M-Cy. Si 
noterà che si riottiene cosi la situazione del $ 6.3. 

Per soddisfare (F,) si effettua un passaggio al limite atto ad assicurare che 
due sezioni uguali in un intorno di xe M sono effettivamente localmente uguali. 
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Sia %U, il filtro degli intorni di x. Poiché la categoria degli insiemi ammette limiti 
induttivi, si può costruire il limite induttivo 


E,= lim (P(U), PG). 


i: Ve> Ue 


E, è la fibra in x dello spazio Er che si cerca. Sia Er la somma insiemistica degli 
E, per xe M. Er è per definizione dotato d’una proiezione rp : Ep>M. Sia 
feT(U) una sezione del prefascio T' su U. f possiede un’immagine f(x) in E, 
per ogni xe U, immagine detta valore di f in x. Si viene cosî ad associare a f 
una sezione (nel senso insiemistico) f di Er sopra U. Si definisce allora la topo- 
logia di Er come la più fine topologia che rende tutte le f continue. 


TEOREMA. Per la topologia di Er or ora definita la proiezione ty : Ep+M di- 
venta un omeomorfismo locale. 


DEFINIZIONE. Viene chiamato spazio «étalé » su M ogni proiezione continua 
tr: E>M che sia un omeomorfismo locale. 


Si è dunque costruito uno spazio étalé Er che rappresenta l’, il cui fa- 
scio delle sezioni Î' dicesi fascio associato a T°. 


TEOREMA. Se il prefascio T è un fascio, allora Î=T. 


Nella maggior parte dei casi i fasci che intervengono in geometria sono na- 
turalmente muniti d’una struttura algebrica, i I'(U) essendo gruppi, anelli, mo- 
duli, ecc. e le applicazioni di restrizione essendo dei morfismi per tali strutture. 
Un caso fondamentale è evidentemente quello dei fasci di funzioni sulle va- 
rietà. Se ad esempio M' è una varietà differenziabile (rispettivamente olomorfa), 
il fascio delle applicazioni differenziabili (rispettivamente olomorfe) f : U+R 
(rispettivamente f : U+(C) ove U è un aperto di M, è un fascio di anelli detto 
il fascio strutturale di MM e denotato Oy. Molte proprietà globali di M si posso- 
no «leggere» su Oy. 

Se i fasci hanno assunto una cosf grande importanza, ciò dipende dal fatto 
che offrono un’interpretazione funzionale del passaggio dal locale al globale alla 
quale si possono trasferire «fibra a fibra » le nozioni fondamentali dell’algebra 
(cfr. il $ 6.2 del citato articolo « Geometria e topologia »). 


7.2. Coomologia dei fasci. 


Come si è visto a proposito delle fibrazioni localmente triviali, la coomologia 
a valori in un fibrato di coefficienti è lo strumento fondamentale per misurare le 
ostruzioni al passaggio dal locale al globale. È dunque naturale cercare di pro- 
lungarne la definizione ai fasci; esistono essenzialmente due modi per introdurre 
la coomologia a valori in un fascio. Uno, detto coomologia di Cech, privilegia il 
modo in cui la base X è ottenuta per incollamento, mentre l’altro privilegia l’a- 
spetto algebrico del problema. Si tratta poi di confrontarli e di cercare condi- 
zioni necessarie e sufficienti (sia relative allo spazio di base sia ai fasci conside- 


Locale/globale 482 


rati) affinché essi coincidano (teoria delle successioni spettrali) [tali argomenti 
delicati sono esposti in dettaglio in Godement 1964; si veda anche l’articolo 
«Invariante» in questa stessa Enciclopedia]. 

La coomologia dei fasci offre uno strumento notevolmente comodo e po- 
tente per l’analisi delle proprietà globali degli oggetti geometrici. 


8. L'opposizione locale/globale in aritmetica. 


Dopo aver esposto schematicamente certi aspetti della dialettica locale/ 
globale in geometria, si vedrà perché e come tale dialettica può operare anche in 
aritmetica ed in modo non metaforico. Questo è chiaramente d’importanza capi- 
tale. Infatti a partire dal momento in cui la dialettica locale/globale si rivela im- 
manente ai «substrati » ideali costituiti da un lato dallo spazio e dall’altro dai nu- 
meri, tutto fa credere che i metalinguaggi (categoriali) di incollamento sono 
in certa misura universali e devono perciò avere a che fare con un’immanenza 
logica. Su questo argomento si tornerà nella conclusione. 


8.1. Divisibilità, congruenze e numeri p-adici. 


Alcuni tra i problemi più fondamentali e difficili dell’aritmetica sono i proble- 
mi diofantei, consistenti, data un'equazione algebrica f(x,, ...,%n) =0 a coefficienti 
interi 0 razionali, nel trovarne una soluzione intera o razionale. Il più famoso di 
tali problemi è senza dubbio la congettura di Fermat, il quale afferma che per 
n=3 l’equazione diofantea x*+y"=" è priva di soluzioni intere non banali. 

Il più importante metodo di risoluzione delle equazioni diofantee consiste 
in approssimazioni successive basate sulla nozione di congruenza. 

Sia p un numero primo. È noto (si veda il $ 5 dell’articolo « Divisibilità » in 
questa stessa Enciclopedia) che l'anello quoziente F,=Z/pZ è un corpo finito di 
caratteristica f, canonicamente incluso in ogni corpo di caratteristica p. Lavo- 
rare in F,, significa lavorare «modulo p ». Se f(x, ..., x.) =0 è un’equazione dio- 
fantea a coefficienti interi, ad essa verrà associata la sua riduzione modulo f 
În(%» + %n)==0 ottenuta sostituendo i coefficienti di f con le loro immagini in 
F,, e se ne cercheranno le soluzioni in F,. Si cercherà dunque dapprima di risol- 
vere la congruenza f(x,, ..., x,)==0 (mod p) che è molto più semplice del pro- 
blema iniziale. 

Ma la congruenza f=0 (mod p) è un’approssimazione estremamente grosso- 
lana dell’equazione diofantea f=0. Si è dunque portati a rendere più fine tale 
approssimazione da una parte facendo variare p nell'insieme 9 dei numeri pri- 
mi, dall’altra cercando soluzioni modulo le potenze successive p° di p. Il proble- 
ma diventa ovviamente quello di dominare il «passaggio al limite », quando s di- 
venta infinito, di tali approssimazioni sempre più fini. 

Se (41, ..., 4,)€ Z” è una soluzione intera di f=0, è chiaro che si avrà f(4,, 

.., Ay)==0 (mod p*) per ogni numero primo pe? ed ogni s>o. Si tratta di 
sapere sotto quali condizioni esiste una reciproca. Tale problema è altamente 
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non banale nella misura in cui le soluzioni possibili di f=0 (mod p°) (suppo- 
nendo ch'’esistano per ogni peP ed ogni s>o0) non hanno a priori alcuna ragione 
di essere tra loro compatibili. 

Uno dei primi grandi risultati in tal campo è il teorema di Minkowski sulle 
forme quadratiche. 


TEOREMA (Minkowski). Sia f(x, ..., %n)= È C;j3%;%; una forma quadratica a 


coefficienti razionali. Se la congruenza f=0 (mod p°) ammette una soluzione non 
banale (‘ossia diversa da (0, ...,0)) per ogni peP e ogni s>o, e se l'equazione f = 
ammette una soluzione reale non banale, allora l'equazione diofantea f=0 ur 
una soluzione razionale non banale. 


Si vedrà ora perché tale teorema è paradigmatico del passaggio dal locale al 
globale in aritmetica. Per questo è utile ricordare la nozione di numero p-adi- 
co dovuta a Hensel: si tratta di numeri rappresentati sotto la forma di serie 


Y anp" a coefficienti a, nel corpo finito F, (cfr. il citato articolo « Divisibilità »). 
#20 
Hensel doveva lavorare modulo p* facendo tendere s all'infinito e doveva dunque 


riuscire a controllare il «passaggio al limite » delle congruenze modulo p*. Di 
qui l’idea di trasportare all’aritmetica il paradigma di approssimazioni successi- 
ve costituito dallo sviluppo di Taylor, cioè di rappresentarsi la successione delle 
congruenze modulo ) come la successione dei troncamenti successivi d’uno svi- 
luppo infinito. Orbene, se si tiene presente tale analogia non tanto da un sem- 
plice punto di vista tecnico quanto da un punto di vista concettuale, si consta- 
ta subito ch’essa conduce all’idea notevole che un numero intero x sia in certo 
qual modo una «funzione» sull’«insieme dei punti» costituito dai numeri pri- 
mi, funzione il cui valore in p è l’immagine di x in F, e che la serie di Taylor, 
la quale esprime la sua struttura «locale» nell’«intorno » di p, sia lo sviluppo 
p-adico di n. 

Dalla pubblicazione dei lavori pionieristici di Hensel questa immissione di 
un paradigma geometrico nell’aritmetica si è notevolmente chiarificata. Si con- 
sideri la successione di quozienti Z/p°Z. Essa costituisce un sistema proiettivo 
> Z/pZ+Z/p>Z-+...+Z/pZ=F,-0. 


DEFINIZIONE. L’anello Z, degli interi p-adici è il limite protettivo di questo 
sistema. 


Questa definizione equivale alla seguente: se n è un intero, ogni numero pri- 
mo interviene con un certo esponente (in generale nullo) nella decomposi- 
zione di x in fattori primi. Quest'esponente dicesi valutazione di x in f e si de- 
nota (1). Se v,(n)=0, n è primo con p. Se si pone per convenzione vp(0)= 
= +, è facile verificare che la valutazione p-adica v, soddisfa le due proprietà 
fondamentali: 


(1) Up(xy) = vp(£)-+.0,(9) 


(2) Up (x+y)> Inf(9, (x), Up (9) (x,y) eZ 
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Ciò implica che l’applicazione che ad ne Z associa il numero |n|,= exp( — Up (1) 
è una norma su Z, detta norma p-adica soddisfacente a una disuguaglianza più 
stretta della disuguaglianza triangolare, la disuguaglianza ultrametrica 


(3) lx+ylp <Max(|p, 19p)- 


Osservazione: La proprietà d’ultrametricità non è affatto intuitiva, giacché 
essa non è archimedea. Per la norma p-adica i multipli di un numero # sono di 
norma inferiore a quella di n, mentre per la norma standard (valore assoluto) 
sono di norma superiore. 


TEOREMA. L'anello Z, degli interi p-adici è il completamento di Z per la norma 
p-adica. 


Se si passa ora da Z a Q è facile estendere la valutazione p-adica ponendo 
vp(n/m)=vp(n)-v,(m). Ciò definisce la norma p-adica | |, di Q e il comple- 
tamento di Q per | |, dicesi corpo Q, dei numeri p-adici. Z s’identifica con 
un sottoanello denso di Z, e Q con un sottocorpo denso di Q, (che ha dunque 
caratteristica 0). 

Questa descrizione dei numeri p-adici in termini di valutazioni e di norme è 
capitale poiché si può dimostrare che le sole norme su Q sono la norma stan- 
dard (valore assoluto) e le norme p-adiche. Ciò permette di precisare in che 
senso i numeri primi sono i «punti» di uno «spazio substrato » sul quale i nu- 
meri diventano «funzioni ». Questo spazio substrato ideale E, proprio dell’arit- 
metica di Q, è costituito dai punti — chiamati anche posti di Q — che sono le va- 
lutazioni ultrametriche v, per peP (posti finiti) e il valore assoluto (posto «al- 
l’infinito »). Q è un'entità globale associata a questo spazio substrato £. Ciò per- 
mette di capire in che senso il teorema di Minkowski è in definitiva un teorema 
di passaggio dal locale al globale. 


TEOREMA (Minkowski). Sia f una forma quadratica su Q. Se f=0 ammette 
una soluzione non banale su R, e se, per ogni pe?P, f=0 ammette una soluzione non 
banale su Q,, allora f=0 ammette una soluzione non banale su Q. In altri termini, 
sef=o0 ammette in ogni posto di Q una soluzione locale essa ammette una soluzione 
globale. 


8.2. Legge di reciprocità, adeli, ideli. 


Per estendere il teorema di Minkowski al caso di un corpo di numeri alge- 
brici qualunque, Hilbert ha riformulato la legge di reciprocità quadratica di Lé- 
gendre-Gauss (discussa alla p. 129 del citato articolo « Dualità ») come teorema 
di passaggio dal locale al globale; per dimostrare tale teorema egli ha ritrovato il 
problema dei corpi di classe posto da Weber: si tratta di un esempio partico- 
larmente luminoso di ciò che Jean Dieudonné chiama l’unità della matematica 
moderna. 

Rimandando al $ 1.3 del citato articolo « Dualità » e al $ 5 di «Divisibilità » 
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per ulteriori dettagli, si ricordi solo che è proprio la localizzazione dei corpi di 
classe alla base della introduzione delle nozioni di ideli ed adeli. L'importanza 
dell’introduzione dei gruppi di ideli e di adeli proviene dal fatto che essi sono 
naturalmente muniti d’una struttura di gruppo topologico localmente compatto. 
Si possono dunque applicare loro i risultati dell’analisi armonica e generalizzare 
cosî in un quadro unitario le tecniche analitiche introdotte da Dirichlet e Rie- 
mann in aritmetica (teoria delle funzioni zeta e delle funzioni L). 


9. La sintesi della geometria algebrica. 


La geometria algebrica moderna è la sintesi di molti punti di vista. Anzitutto 
essa continua le ricerche (dovute essenzialmente alla scuola italiana) per gene- 
ralizzare i risultati di Riemann in dimensione superiore (cfr. l'articolo « Curve 
e superfici »). Inoltre essa cerca di trasportare a livello algebrico le tecniche e i 
concetti propri del livello analitico e ciò in modo astratto, valido per ogni corpo 
di base, cioè non limitandosi ad utilizzare il fatto che nel caso della geometria 
algebrica su C, il livello analitico è sempre soggiacente al livello algebrico. In- 
fine essa cerca, soprattutto dopo i lavori di André Weil, di prolungare il punto 
di vista di Dedekind-Weber integrando le questioni aritmetiche. 

I suoi strumenti essenziali sono da un lato l’algebra commutativa che tra- 
duce in termini algebrici i concetti fondamentali della geometria e permette di 
controllarli con il calcolo (punto di vista introdotto da Hilbert e sviluppato so- 
prattutto da Noether e Zariski) e d’altro lato (soprattutto dopo i lavori di Gro- 
thendieck) il linguaggio categoriale della coomologia dei fasci. 

La sintesi effettuata in geometria algebrica è straordinaria sia per la diversità 
delle tecniche sia per l’unità dei metodi. Si può dire che per sua stessa natura 
la geometria algebrica si situa al crocevia della matematica contemporanea. Sa- 
rebbe completamente utopico pensare di presentarne gli elementi in qualche 
pagina, anche solo quelli che si riferiscono all’algebrizzazione della dialettica 
locale/globale e del concetto d’incollamento. Ecco perché per un panorama di 
tali risultati si rinvia da un lato agli articoli specifici di questa stessa Enciclopedia 
via via indicati e dall’altro al trattato ormai classico di Dieudonné [1974]. 


10. Conclusione. 


Per concludere questa incursione nel campo dei diversi aspetti dialettici del- 
l’opposizione locale/globale si ritorna ora sul problema del linguaggio, della sua 
sintassi e della sua semantica. Uno degli apporti epistemologici pit significa- 
tivi dell’approfondimento matematico delle molteplici connessioni fra le opera- 
zioni di localizzazione e di globalizzazione pare, a chi scrive, essere la possibi- 
lità di riformulare il problema teorico della lingua. Se si tiene conto del fatto 
che il problema posto dall’implicazione reciproca fra la lingua e l'intuizione spa- 
ziale è uno dei più antichi problemi filosofici, appare di estremo interesse capire 
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perché e come le «geometrie» associate all’opposizione locale/globale possano 
sfociare in problemi di semantica e di grammatica. 

Poiché si tratta di problematiche in larga parte inesplorate, ci si limiterà solo 
ad alcune considerazioni di carattere generale. Si vuole unicamente sottolineare 
come esistano attualmente due approcci che paiono promettenti. Uno di essi 
- dovuto essenzialmente a Lawvere e Tierney — fa sfociare nella logica i meta- 
linguaggi dell’incollamento introdotti da Grothendieck nella teoria degli schemi. 
L’altro — quello della teoria delle catastrofi — fa sfociare nella schematizzazione 
delle strutture sintattiche elementari (sia grammaticali sia semantiche) la teoria 
delle singolarità differenziabili e dei loro dispiegamenti. Risulta dunque che tutti 
e due i punti culminanti della dialettica locale/globale — quello della sintesi fra 
il punto di vista di Riemann e l’aritmetica, e quello del «programma di Thom- 
Smale » — «riconducono » la geometria alla sintassi, allacciandosi in modo speci- 
fico ad uno dei due aspetti fondamentali del problema, il primo sugli automa- 
tismi logico-sintattici di iterazione, il secondo sugli archetipi morfologici ai qua- 
li tali automatismi si applicano. Per ora si tratta solo di una constatazione un 
po’ enigmatica. Tuttavia l’autore del presente articolo ritiene che forse dietro 
di essa si profila una revisione profonda del nostro modo classico di concepire 
i rapporti tra linguaggio e realtà. 


10.1. Logica e teoria dei topoi. 


Come si è visto, un prefascio su uno spazio topologico X è un funtore con- 
trovariante della categoria piccola M degli aperti di X nella categoria degli in- 
siemi. Si può dunque generalizzare tale nozione a una categoria M qualunque. 
Per poter allora parlare di fascio e cioè di prefascio che soddisfa le condizioni di 
incollamento (F;) e (F»), basta disporre in M di una nozione di ricoprimen- 
to aperto. Per questo non è affatto necessario che M sia la categoria degli aperti 
di uno spazio topologico; infatti i ricoprimenti aperti R(U) degli aperti U di 
uno spazio topologico _X sono caratterizzati dalle proprietà fondamentali: 


a) 1g : U+UeR(U). 
b) Se (Ue R(U) e (Ui;)jeg, € R(U) per ogni ie/, allora (U;;)iery jex; € 
R(U 


c) Se (U));7eR(U) e se V> U, allora (U:NV)reR(V). 


Nella categoria M degli aperti di X, l’intersezione di due aperti U; e V di U 
è semplicemente il prodotto fibrato U;x V e la nozione di prodotto fibrato è 


puramente categoriale. Se M è una qualunque categoria che ammette prodotti 
fibrati, si può allora definire una topologia suM (detta topologia di Grothendieck) 
associando ad ogni oggetto U di M un insieme R(U) di famiglie di morfismi 
(U;> U);er dette famiglie ricoprenti che verificano la traduzione categoriale de- 
gli assiomi a), b) e c). Una categoria munita di una topologia di Grothendieck è 
detta sito. I siti sono, per definizione, i «substrati» dei fasci e ciò permette di 


generalizzare in modo notevole le tecniche coomologiche della teoria dei fasci. 
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DEFINIZIONE. La categoria dei fasci su un sito è detta topos. 


La possibilità di applicare questo concetto generale dei fasci a situazioni 
astratte deriva da un teorema di Jean Giraud che caratterizza categorialmente 
i topoi fra le categorie. 

I due esempi essenziali di topoi sono forniti da un lato dalla categoria È 
degli insiemi e, dall’altro, dalla categoria dei fasci 7, su uno spazio topologico 7. 
Si tratta naturalmente di topoi molto diversi. L'osservazione fondamentale di 
Lawvere è che la logica dei predicati della teoria degli insiemi può essere com- 
pletamente riformulata in termini categoriali a partire dalla struttura di topos 
di &. Di qui l’idea veramente profonda di considerare ogni topos come l’am- 
bito naturale di una «logica interna» ad esso canonicamente associata. Passan- 
do dalla categoria degli insiemi & alle categorie dei fasci su spazi topologici, si 
può estendere in modo cospicuo la nozione di linguaggio logico. Si può cosi 
formulare quello che vi è di troppo «rigido» nella teoria classica degli insiemi. 
Come osserva Lawvere [1972, pp. 3, 4], «il topos più ‘‘astratto”’ è la usuale ca- 
tegoria degli insiemi è e delle applicazioni nella quale, per cosî dire, lo svilup- 
po [degli insiemi] è stato congelato in modo che i morfismi X + Y siano intera- 
mente determinati da come operano sugli elementi “globali” od ‘eterni’ di 
X... Non essendovi qui alcuno sviluppo negli oggetti di è, non vi è alcun impe- 
dimento all'esistenza di funzioni di scelta, ed anzi in un certo senso l’assioma di 
scelta caratterizza i modelli della teoria degli insiemi fra i topoi». Per contro, se 
si considerano i topoi che sono categorie di fasci su uno spazio topologico oppure 
categorie di prefasci su quelle categorie particolari che sono gli insiemi preor- 
dinati, si può ad esempio localizzare la quantificazione («è localmente vero che ») 
oppure far variare la nozione di verità in funzione degli «stadi del sapere » (se- 
mantica intuizionista dei mondi possibili). Come osserva ancora Lawvere [:b:4d., 
p- 3], «si può dire in conclusione che la nozione di topos sintetizza in forma og- 
gettiva categoriale l'essenza ‘‘delle logiche di ordine superiore”... senza assioma 
di estensionalità. T'ale fatto conduce ad una naturale e utile generalizzazione 
della teoria degli insiemi consistente negli ‘insiemi che si sviluppano interna- 
mente”. In un fondamentale esempio della geometria algebrica lo sviluppo può 
pensarsi avvenire lungo un parametro che varia sugli ‘anelli di definizione”; in 
un fondamentale esempio della logica intuizionista, il parametro è interpretato 
come variante negli ‘‘stadi del sapere” ». 


10.2. Teoria delle catastrofi e ipotesi localista. 


Alcune ricerche recenti fanno presumere che la teoria dei topoi offra un am- 
bito naturale per comprendere gli automatismi sintattici delle lingue naturali. 
Tuttavia il fenomeno linguistico non si riduce al livello della generatività gram- 
maticale. Esso include almeno due altri livelli: 1) quello semantico; 2) quello 
delle morfologie sintattiche elementari di base che servono di ingresso agli au- 
tomi generativisti. 

Il problema della semantica è troppo vasto per essere affrontato in questa 
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sede. Passando allora al punto 2), il problema posto dall'esistenza di un nucleo 
di morfologie sintattiche archetipe che servano di ingresso alle trasformazioni 
sintattiche è apparentemente molto semplice ma incappa in notevoli difficoltà 
di modellizzazione. In breve si tratta del seguente problema. Tutto porta a cre- 
dere che esistano, a livello delle strutture linguistiche profonde, degli schemi 
elementari di interazioni attanziali aventi carattere universale. La manifestazio- 
ne linguistica superficiale di questi schemi è l’esistenza di casi (nominativo, 
accusativo, dativo, ecc.) caratterizzati da desinenze, come in latino, oppure da 
preposizioni, come nella maggior parte delle lingue europee. Appare dunque 
naturale supporre che, al di là della diversità degli indicatori dei casi, specifici 
di ogni lingua, esista un nucleo di casi profondi e universali. Che cosa è un 
caso profondo? A priori si deve asserire che si tratta di un posto in uno schema 
d’interazione di posti. Per esempio il verbo ‘dare’ lessicalizza in italiano uno 
schema d’interazione fra tre posti: quello del destinatore (nominativo), quello 
del destinatario (dativo) e quello dell’oggetto trasmesso (accusativo). Nume- 
rosi lavori hanno mostrato che esistono ben pochi schemi elementari universali 
d’interazione e che a) tali schemi paiono aver fornito le «matrici» della strut- 
tura casuale di tutti i verbi; 2) tali schemi sembra operino sia a livello stret- 
tamente grammaticale sia a livello (semantico) delle cosiddette strutture nar- 
rative. 

Il problema diviene allora quello di modellizzare, o meglio di dedurre da 
principî generali, schemi d’interazione casuali astratti, corrispondenti al nucleo 
evidenziato dagli approcci casuali (Tesnière, Fillmore, Anderson, ecc.). Si tratta 
di una questione assai delicata, giacché non si può assimilare una relazione ca- 
suale a una relazione nel senso logico del termine e partire da relazioni binarie 
di base per costruire, mediante combinazioni, relazioni più complesse. La no- 
zione di relazione casuale è una nozione per la quale l'opposizione semplice/ 
complesso è non pertinente. Certamente fenomeni linguistici quali l’esistenza 
degli incoativi mostrano come alcune interazioni casuali possano ridursi ad in- 
terazioni più semplici. Ciò non toglie però che a un altro livello ogni interazione 
casuale elementare (cioè lessicalizzabile con un unico verbo) sia irriducibile. 
D'altro lato se si trasformassero le relazioni casuali in relazioni logiche, nulla 
impedirebbe di renderle a mano a mano più complicate. È tuttavia un fatto di 
ovvia esperienza (e linguisticamente universale) che la «valenza » dei verbi (se- 
condo la metafora chimica usata da Tesnière per immaginare il numero di posti 
casuali articolati da un nodo verbale) è fortemente limitata (circa 4). 

In conclusione si può dire che il problema posto dall’esistenza di un nucleo 
di schemi astratti di interazioni casuali ha quattro aspetti: 


1) capire come tali interazioni possano essere congiuntamente riducibili ed 
irriducibili; 

2) capire a cosa è dovuta la loro pregnanza (universalità); 

3) capire perché la loro complessità è fortemente limitata; 

4) capire come esse hanno potuto servire da «matrici» e «catturare » tutte le 
morfologie sintattiche elementari. 
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Fin dall'epoca dei grammatici della scuola di Bisanzio si è sovente ipotizza- 
to che per risolvere tale quadruplice problema si doveva assolutamente tenere 
conto delle possibili interazioni spaziali tra attanti concreti. Tale ipotesi, detta 
ipotesi localista, significa che ogni caso è passibile di una doppia interpretazione: 
una propriamente grammaticale e l’altra locale, cioè spaziale. Fino ad ora però 
tale ipotesi — la cui storia è splendidamente narrata nel classico La catégorie des 
cas di Hjelmslev [1935-37] - non ha mai potuto essere convalidata formalmente 
e con ciò stesso fondata. In effetti l'ipotesi localista cerca di dare un senso ri- 
goroso alla nozione di colocalizzazione dei posti articolati da un centro organiz- 
zatore (nodo verbale). Ciò presuppone però che si sappia formalizzare il con- 
flitto fra posti, ossia il processo dialettico di unione e di differenziazione dei posti 
in uno schema d’interazione. È chiaro infatti che «l'identità» dei posti non può 
provenire dai posti stessi ma solo dal loro rapporto dialettico. 

A questo punto interviene il paradigma catastrofista. La teoria delle cata- 
strofi è la prima teoria adattata a problemi del tipo di quelli posti dall’ipotesi lo- 
calista, giacché essa fornisce i primi modelli di conflitto dialettico e classifica le 
interazioni elementari archetipe fra attanti spaziali. Esiste una interpretazione 
sintattica delle catastrofi elementari [descritta alla fine di Thom 1972 ed utiliz- 
zata a scopi semantici in Petitot 1977] la quale fornisce una deduzione a priori 
(si potrebbe anzi dire trascendentale) degli universali casuali. La teoria delle 
singolarità s’innesta cosi, in modo imprevisto, sulla linguistica, fornendo una 
risposta profonda e coerente ai punti 1)-4). 


A partire da alcune osservazioni generiche sulla semantica, si è attraversato 
l'universo dei vari aspetti matematici dell’opposizione locale/globale per con- 
cludere sulle difficoltà inerenti alla schematizzazione delle forme linguistiche. 
La possibilità di percorsi epistemologici di questo tipo è la premessa di un nuovo 
tipo di implicazione fenomenologica della matematica che, forse, permetterà 
di trasformare in modo profondo il nostro rapporto con la scienza. Qualunque 
ne sia lo sviluppo, è però evidente che l’opposizione locale/globale deve d’ora 
in poi essere considerata come una delle categorie fondamentali della ragion 
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Comparsa all’interno delle matematiche (cfr. anche catastrofi, differenziale, 
| funzioni, geometria e topologia, invariante, spettro), l'opposizione locale/globale 

(cfr. opposizione/contraddizione) ha assunto una portata generale nell’ambito della 

filosofia (cfr. filosofia/filosofie) e della scienza. Nella filosofia essa permette di enun- 
| ciare in modo nuovo e di proporre soluzioni originali a numerosi problemi (cfr. coppie 

filosofiche), come quello del tutto e delle parti (cfr. totalità, dialettica), degli univer- 
| sali/particolari, dell’unità e molteplicità (cfr. uno/molti). Nelle teorie (cfr. teoria/mo- 
Il dello) della conoscenza, l’opposizione locale/globale è presente in modo particolare 
| in quanto problema dell’induzione/deduzione; essa si può reperire anche nella se- 
mantica e in generale ovunque si ponga il problema del significato (cfr. senso/signi- 
| ficato). Nella scienza ci s'imbatte in questa opposizione non appena si affronti il pro- 
ti) blema delle leggi (cfr. legge) scientifiche e quello del determinismo (cfr. determinato/ 
il indeterminato); essa inoltre è al centro della cosmologia contemporanea (cfr. cosmo- 
logie, universo, spazio/tempo; e ancora: astrologia, astronomia, mondo, natura, 
caos/cosmo, ordine/disordine). 
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La nozione di sistema di riferimento è d’importanza fondamentale sia per 
la matematica sia per la fisica. Essa è però divenuta talmente ovvia che spesso 
si dimentica che è tra le più ricche e feconde della geometria. Se può essere al 
tempo stesso cosi basilare eppure cosi ovvia, è perché si tratta di una nozione 
che non concerne direttamente la realtà dei fenomeni, bensi le condizioni di pos- 
sibilità della descrizione dei fenomeni stessi, e la caratteristica delle grandi teorie è 
la possibilità di dedurre una parte importante della realtà dei fenomeni dallo 
studio matematico approfondito delle condizioni di possibilità della loro descri- 
zione. 

Se ci si proponesse un'esposizione esaustiva di questa nozione proteiforme, 
si dovrebbe ripercorrere tutto il sapere matematico e quello fisico poiché non 
vi è praticamente alcun dominio di tali scienze in cui essa non intervenga in 
maniera costitutiva. Una simile esposizione sarebbe dunque un doppione di 
molti altri articoli di quest’ Enciclopedia ai quali si farà a mano a mano cenno, 
senza ulteriori specificazioni, in questo articolo, in cui ci si limiterà a riesamina- 
re, in modo lacunoso ed incompleto sia a livello fisico-matematico sia a livello 
storico, solo alcuni aspetti della problematica del riferimento. 


1. La necessità del riferimento. 


Il verbo ‘riferire’ si usa tanto nella forma transitiva (‘riferire qualcosa’) quan- 
to in quella riflessiva (‘riferirsi’). In entrambi i casi inquadra un problema di 
posizione, una strategia finalizzata a definire un posto. Il suo contesto generale è 
perciò caratterizzato dall’esistenza di uno spazio E («substrato » delle posizioni 
e dei posti possibili), di un oggetto O (l’oggetto cui si vuole assegnare una po- 
sizione) e di un soggetto .S (agente della strategia di ricerca). 

A partire da questo contesto generale, si possono distinguere tre tipi empi- 
rici di situazione di riferimento, tra loro radicalmente diversi: 


1) Anzitutto vi è il caso in cui £ è uno spazio contrassegnato, reso eterogeneo. 
da punti o da zone fenomenologicamente distinguibili. La strategia consi- 
sterà allora essenzialmente nel «reperire» tali punti di riferimento. Per 
fare ciò occorre che il soggetto S abbia una visione relativamente globale 
dello spazio £. 

2) Vi è poi il caso in cui il soggetto .S non può disporre d’una visione rela- 
tivamente globale dello spazio E, a prescindere dal fatto che lo spazio E 
sia o non sia contrassegnato ossia che esistano o meno punti di riferimen- 
to. In tal caso il soggetto diventa «miope», non potendo che riferirsi lo- 
calmente, cioè rispetto a ciò che gli sta attorno, a breve distanza, e non 
rispetto a tutto lo spazio E. Una tale situazione potrebbe chiamarsi labi- 
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rintica. La strategia di riferimento presuppone in tal caso una strategia 
di uscita dal labirinto (cfr. « Centrato/acentrato», « Labirinto»). 

3) Vi è infine il caso in cui il soggetto è dotato di una visione globale dello 
spazio E (cioè trattasi di un osservatore), in cui però lo spazio E è « non- 
contrassegnato », non possiede cioè punti di riferimento, è uno spazio 
omogeneo. Questo è il caso di un navigatore su un oceano, oppure di chi 
percorre un deserto. 


Quest'ultima situazione è alla base della nozione di sistema di riferimento. 
Infatti è proprio nel caso in cui, essendo £ uno spazio omogeneo, l'osservatore 
non dispone di alcun punto di riferimento inerente ad E, che si rende necessario 
l’uso di un riferimento nel senso di un sistema di coordinate. 


2. La fecondità concettuale della nozione di riferimento. 


Se si volessero valutare le radici antropologiche, culturali, rappresentative e 
simboliche della nozione di riferimento bisognerebbe rintracciare in tutta la sua 
complessità fenomenologica e la sua densità storica la conquista del concetto di 
spazio a ciò che Husserl chiamava la Lebenswelt. Si sarebbe cosî condotti da un 
lato all’analisi antropologica della rappresentazione dello spazio nelle diverse 
culture (in particolare nelle società primitive in cui lo spazio è locale e simboli- 
camente strutturato dall’opposizione sacro/profano: cfr. « Religione », € Purofim- 
puro», «Sacro/profano»), dall’altro all’analisi della sua genesi psicologica, come 
anche all'analisi della desemantizzazione cosmologica dello spazio (passaggio dal- 
l’astrologia all’astronomia) e all’analisi dell’equivalenza, a suo tempo rivoluzio- 
naria, dello spazio celeste e dello spazio sublunare, nonché all’analisi dei rappor- 
ti tra spazio pittorico prospettico e rappresentazione topografica delle relazioni 
narrative, all’analisi della cartografia, ecc. Tutti questi problemi, cosî delicati, 
sono stati profondamente e largamente dibattuti; si potrà far riferimento a due 
esempi classici: l’opera di Koyré From the Closed World to the Infinite Universe 
[1957] e la summa impressionante di Duhem [1913-16] (cfr. anche « Infinito», 
«Mondo» e « Universo »). 


2.1. Le coordinate cartesiane. 


Allorché si delinea il problema di fornire un riferimento in uno spazio omo- 
geneo, cioè privo di punti di riferimento, cioè di punti fenomenologicamente 
distinti, la nozione di sistema di coordinate diventa necessaria. Supponendo che 
lo spazio E sia munito di struttura euclidea, è possibile definire i riferimenti co- 
me i sistemi massimali di n rette passanti per un medesimo punto, a due a due 
ortogonali (riferimenti cartesiani). Se si assumono poi delle unità di misura su 
ciascun asse, ogni punto x di E diventa «riferito » rispetto ad un tale riferimento 
cartesiano R dando le sue n coordinate (x, X9, ..., %y) cioè assegnando una x-pla 
ordinata di numeri reali. Grazie a tale procedimento, E è posto in corrispon- 
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denza biunivoca con un modello base standard, ossia il prodotto diretto R" di 
n esemplari della retta reale R, il quale, contrariamente ad E, è munito di un 
sistema di riferimento canonico, cioè quello composto dai vettori e;= (0, ..., 0 
1, 0, ...,0) (con il numero 1 nella î-esima posizione), î= 1, ..., n. 

Non s’insisterà mai a sufficienza sulla rottura provocata dall’introduzione 
delle coordinate cartesiane. Essa è all’origine di tutta la geometria algebrica e 
differenziale moderna (cfr. del resto « Geometria e topologia»). Eccone subito 
alcune conseguenze le cui diramazioni sono divenute sostanzialmente coesten- 
sive al campo geometrico. 

Sia R un riferimento cartesiano di E. Il fatto che ogni punto x di E diven- 
ga, mediante R, «codificato» da una n-pla ordinata di numeri reali permette 
d’introdurre delle descrizioni algebriche; ciò significa immergere la geometria in 
quella rivoluzione dell’ordine simbolico ch'è stata il perno dello sviluppo dell’al- 
gebra. Allorché si dispone della nozione di variabile si può dire che un punto x 
di E è rappresentato dai valori delle x variabili x,, x», ..., x, Avendo poi a di- 
sposizione la nozione di funzione si può affermare che un «luogo» di E (cioè 
l'insieme dei punti di E soddisfacenti a certe proprietà o generati applicando 
una certa regola) è rappresentato da un certo numero di equazioni Fn 
%y) =0. Disponendo infine delle nozioni di differenziazione si possono tradurre 
le proprietà infinitesimali (in particolare tangenziali) dei «luoghi» di E. Cosî, 
attraverso le nozioni cruciali di variabile, di funzione, di derivata e di differen- 
ziale si è spalancato l'immenso universo del trattamento simbolico degli oggetti 
geometrici di E. Ciò ha permesso non solo di riesprimere e di risolvere con 
metodi uniformi (come quelli, ad esempio, dell’eliminazione) i problemi classi- 
ci della geometria euclidea, ma ha permesso anche di aprire orizzonti radical- 
mente nuovi la cui investigazione metodica e concettuale è ben lungi dall’essere 
compiuta. 

La «codificazione» dei «luoghi» di E mediante sistemi di equazioni f(x,, ..., 
Xn) =© vincolerà irreversibilmente una parte della geometria alle funzioni « cal- 
colabili», cioè alle funzioni il cui valore può essere calcolato con applicazioni 
successive di operazioni algebriche di base. Tali funzioni sono le funzioni poli- 
nomiali. Sia A l’anello dei polinomi in x variabili su R, A =R[x,,..., x]. Se P 
è un elemento di A e R un sistema di riferimento cartesiano di £, è possibile 
associare ad ogni punto x= (x, ..., x,) di E il valore P(x) di P in x. Si possono 
dunque considerare i sottoinsiemi V di E definiti dall’annullarsi di un sistema 
P,, ..., P; di polinomi. Un tale sottoinsieme si dice algebrico e la nozione di in- 
sieme algebrico è la nozione primitiva della geometria algebrica (cfr. « Geome- 
tria e topologia», « Curve e superfici», « Invariante»). 

Assegnare un sistema di riferimento è una condizione che rende possibile la 
descrizione simbolica degli oggetti geometrici, ma tale condizione è estrinseca. 
È a priori evidente che gli oggetti geometrici di E sono indipendenti dalla scel- 
ta di ogni sistema di riferimento o anche (punto di vista complementare) che, 

se sono dati un oggetto X di E e un cambiamento di riferimento R+' e se si 
considera l'oggetto X' con una descrizione rispetto ad R' identica a quella di 
X rispetto ad R, allora X e X” sono oggetti equivalenti. Tale evidenza a priori 


’ 
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porta al problema della classificazione degli oggetti della stessa natura, in parti- 
colare a quello della classificazione degli insiemi algebrici definiti da un’equa- 
zione P(x)=o di grado d fissato (coniche o cubiche nel piano, quadriche nello 
spazio tridimensionale, ecc.). Come si vedrà meglio più avanti, quest'idea d’in- 
varianza per cambiamenti di riferimento è fondamentale poiché genera gli og- 
getti e si trova all’origine del principio fisico di relatività (cfr. del resto l’omoni- 
mo articolo). 


2.2. Alcuni tipi di coordinate. 


La nozione di riferimento cartesiano è l’esempio originario di sistema di 
coordinate. Ma la nozione di sistema di coordinate ha subito nel corso della 
storia sviluppi, diversificazioni e generalizzazioni considerevoli. Ne verranno 
ora citate alcune aventi livelli concettuali molto diversi fra loro. 

Sia R un riferimento cartesiano di uno spazio euclideo E, ad esempio il pia- 
no. Le famiglie di rette aventi rispettivamente equazioni x=a e y=b (ove x e 
y sono le coordinate rispetto a R) formano un sistema (0 «rete») di curve orto- 
gonali. Per ogni punto di £ passa una e una sola curva di ogni famiglia e queste 
due curve s’intersecano ortogonalmente in tale punto. Più in generale, un siste- 
ma composto da due famiglie di curve intersecantisi trasversalmente, dipen- 
denti ciascuna da un parametro e ricoprenti ciascuna tutto il piano, può essere 
considerato come un sistema di coordinate: le coordinate di un punto sono i 
rispettivi valori dei parametri di ogni famiglia per l’unica curva della famiglia 
che passa per quel punto. Un esempio standard di un tale sistema è dato dalle 
coordinate polari (r, 8) del piano associate al sistema dei cerchi centrati nell’ori- 
gine e delle rette passanti per l’origine. Si noti che tale sistema ammette l’origi- 
ne come punto «singolare», poiché la coordinata angolare è ivi indeterminata. 
Nello spazio a tre dimensioni, si hanno le coordinate cilindriche ottenute ag- 
giungendo alle coordinate polari del piano una coordinata cartesiana per la ter- 
za dimensione; altro esempio si ha con le coordinate di Eulero date dal sistema 
di sfere centrate nell’origine e, su ognuna di tali sfere, delle coordinate angolari 
«geografiche» di longitudine e latitudine. 

La nozione di riferimento cartesiano è legata alla struttura euclidea degli spa- 
zi considerati. È noto però che, per ottenere risultati generali sugli insiemi alge- 
brici, si è stati condotti da un lato ad aggiungere i punti all’infinito (proiettiviz- 
zazione), e dall'altro a considerare i punti a coordinate complesse. Nella geo- 
metria proiettiva complessa del x1x secolo si sono affrontati due punti di vista 
radicalmente opposti. Da una parte quello della geometria detta «sintetica » che 
rifiutava ogni algebrizzazione mediante l’uso di coordinate, dall’altra quello della 
geometria algebrica che voleva adattare a questa nuova struttura le tecniche pro- 
prie della geometria cartesiana. Questo secondo punto di vista si è sviluppato 
grazie all'introduzione delle coordinate omogenee da parte di Mébius, Pliicker e 
Cayley. 

Si considerino ad esempio, in un piano euclideo £, tre punti 2,, 4, e 3 non 
allineati. Siano essi dotati di «masse» 7,, m, ed #1; e se ne consideri il baricen- 
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tro C. Se R=(x, y) è un sistema di riferimento cartesiano di E, le coordinate 
cartesiane x, ed y, di C sono date dalle formule: 


3 3 
x Mix, ZIE: 
__ial __ tal 
Xe 3 Me 3 
Ymi Ymi 
1 î=1 


Mébius ha battezzato m,, 3, 3 coordinate baricentriche di C. È facile verifi- 
care che 


1) facendo variare le «masse» wm,, 719, my si possono generare tutti i punti 
di E ed i punti all’infinito soddisfano alla condizione m,-+my+m3=0; 

2) fissato C, le sue coordinate baricentriche sono definite a meno di un fat- 
tore di proporzionalità k40. 


L’inconveniente di tale definizione è ch’essa presuppone di aver fissato un 
sistema di riferimento cartesiano in E, mentre la struttura proiettiva di un piano 
proiettivo è una struttura più debole di quella affine d’un piano affine che vi è 
immerso. Si può rimediare a questo inconveniente identificando il piano proiet- 
tivo P° con l'insieme delle rette di R? passanti per l’origine e private dell’origi- 
ne stessa. Viene cosi definito un punto di P® mediante una terna (X, Y, T) di tre 
coordinate dette omogenee le quali a) non sono mai tutte e tre nulle, ed inoltre 
b) sono definite a meno di un comune fattore di proporzionalità #40. Se T#0, 
si può allora associare alla terna (X, Y, 7) il punto di un piano cartesiano E 
di coordinate, rispetto a un sistema di riferimento R, x=X/T, y=Y/T. Se 
(RX, RY, AT), k#0, è un’altra terna di coordinate omogenee per lo stesso punto 
di P?, il punto di E che corrisponde a tale terna è proprio il medesimo poiché 


RX XX RY Y 

EP URTOT 
Si ottiene cosi una biiezione tra E e il complementare in P? della «retta al- 
l'infinito» di equazione T=o0. 

. Se allora P(x,y)=0 è l’equazione di una curva algebrica C di E, ad essa 
si può canonicamente associare un’equazione omogenea atta a definire una cur- 
va algebrica proiettiva C’ che prolunga C in P?. Se ad esempio C è una conica di 
equazione ax°+by?+c=o, le si associa l'equazione a(X/T)?+b(Y/T}+c=o0, 
ossia l'equazione omogenea aX?+5Y?+cT?=o. 

. In altri termini, la geometria algebrica proiettiva in P" è l’analisi degli 
insiemi algebrici definiti mediante polinomi omogenei dell’anello dei polinomi 
C[X, Ka; Kt 

._ Ma la nozione di sistema di coordinate è di portata ben più generale. Essa 
interviene infatti ogniqualvolta si voglia rappresentare un’entità dipendente da 
certi parametri come un punto di uno «spazio» di dimensione corrispondente. 
Per questo tale nozione è legata all’enorme generalizzazione del concetto di spa- 
zio che s’è prodotta nel corso del xrx secolo. Eccone qualche esempio. 
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In meccanica un sistema di N punti materiali può essere rappresentato da 
un punto di uno spazio a 3 N dimensioni e, se questi punti sono vincolati da 
condizioni, da un sottospazio di tale spazio. Nella teoria di Fourier una funzio- 
ne periodica può essere considerata un punto di uno spazio funzionale di di- 
mensione infinita e i suoi coefficienti di Fourier diventano, secondo questa in- 
terpretazione, le sue coordinate rispetto al sistema di riferimento costituito dal- 
le funzioni trigonometriche (cfr. per esempio « Calcolo»). 

In geometria proiettiva bidimensionale, se si considera l'equazione omoge- 
nea Xjx1+Xx9+X3x3= 0, essa rappresenta l’equazione di una retta di coordi- 
nate omogenee (X,, X,, X,) se le x; variano e le X, restano fisse, e l'equazione 
del punto di coordinate omogenee (x,, x, x3) (considerato come inviluppo delle 
rette passanti per esso) se le X; variano e le x; restano fisse (principio di dualità 
di Plicker). In generale, in uno spazio proiettivo P* si dispone di coordinate 
omogenee duali per i punti e per gli iperpiani. Nasce cosi il problema di tro- 
vare coordinate omogenee per le sottovarietà di dimensione 1<d<n—1. Si con- 
sideri ad esempio uno spazio proiettivo P® di coordinate omogenee (x, x3, %3, 
x) per i punti e (X,, X,, X,, X.) per i piani. Sia A la retta passante per due 
punti x e y di P* e si consideri la matrice 2 x 4 


| si SI 
Vie Da 
Siano p;; i sei minori p;,;=%;y;—Yi%j tj=1, .-., 4, 14), dyg= —Dyi- È facile ve- 


rificare che, mediante i p,; considerati come coordinate omogenee, la retta A vie- 
ne rappresentata da un punto di P5. Ma poiché i p;; soddisfano la relazione 


(1) PraP23+ PoaP31 +PaaPra = O; 


«lo spazio » delle rette di P® è in effetti rappresentabile mediante la quadrica O 
di P° d’equazione (1). I p;; si chiamano coordinate pliickeriane delle rette di P® 
e la geometria di Q diventa la geometria dei sistemi di rette di P3. Più in gene- 
rale, le sottovarietà lineari di dimensione / di P” si possono rappresentare con i 
punti di una sottovarietà algebrica (non lineare) di uno spazio PY di dimensione 
superiore (teoria delle grassmanniane). 

Non soltanto le sottovarietà lineari di P” possono essere considerate punti 
di una sottovarietà algebrica di PN. Infatti [cfr. Dieudonné 1974] la nozione di 
coordinate plickeriane può estendersi fino a trattare come punti di una varietà 
algebrica proiettiva tutte le sottovarietà algebriche (non lineari) di P®. Sia in 
effetti V una sottovarietà algebrica di dimensione / di P”. Per la dualità tra pun- 
ti e iperpiani di P” si può considerare un sistema .S di /+1 iperpiani di P” co- 
me un punto di (P”)!#1, Si fa allora vedere che il sistema S la cui intersezione 
ha elementi in comune con V forma un’ipersuperficie di (P")"+1 di equazione 
Fy=o0, ove Fy è un polinomio irriducibile omogeneo nelle coordinate omoge- 
nee degli iperpiani di S. I coefficienti di F}, si chiamang coordinate di Chow di V 
e permettono di rappresentare V come un punto di uno spazio PY la cui dimen- 
sione dipende da / e dal grado di V. 

Cosicché, mediante lo sviluppo della geometria in P”, mediante la rappre- 
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sentazione di enti derivati da P” come punti di sottovarietà di PN di dimen- 
sione superiore, la cui geometria ne traduce le proprietà, è sorto progressiva- 
mente uno dei metodi fondamentali della geometria algebrica. 


3. Il passaggio del globale al locale. 


A partire dalla rottura compiuta da Riemann relativamente al contenuto da 
dare al concetto di spazio, i matematici hanno iniziato a considerare spazi gene- 
ralizzati costituiti da enti qualsiasi dipendenti da un certo numero (finito o in- 
finito) di parametri o gradi di libertà. Gli spazi hanno allora preso a proliferare, 
dalle varietà differenziabili agli spazi funzionali. 

Tale generalizzazione del concetto di spazio ha assunto due grandi direzio- 
ni: da una parte quella degli spazi ottenuti per incollamento di pezzi di spazi 
standard (R” o C”) e dall’altra quella degli spazi ottenuti estendendo alla di- 
mensione infinita (in particolare alla dimensione numerabile) la struttura di spa- 
zio vettoriale e la teoria degli operatori lineari. PI, 

Per trattare gli spazi ottenuti per incollamento di pezzi di spazi standard, e 
cioè le varietà differenziabili, analitiche o algebriche, s'è dovuta introdurre la 
nozione di coordinate locali, ossia localizzare la nozione di sistema di riferimen- 
to (cfr. «Locale/globale »). Si ricordi per esempio che una varietà differenziabile 
reale di dimensione n è uno spazio topologico M ricoperto da aperti U;, detti 
carte locali, omeomorfi ad aperti V; di R" mediante omeomorfismi g; ai qua- 
li s'impone di dar luogo a funzioni di incollamento @;0@;: g;(U;N U;)> 
+%;(U,NU)) che siano differenziabili. Se U; è una carta locale di M si pos- 
sono trasportare ad U,, tramite l’omeomorfismo ;-!, le coordinate di V, e si 
ottengono in tal modo le coordinate locali della carta (U,, ;). Ogni sistema di 
coordinate locali (x,, xs, ..., x,) di M in un intorno di xe M definisce un siste- 
ma di riferimento (una base) nello spazio vettoriale 7,,M dei vettori tangenti 
ad M in x. Tali riferimenti tangenti variano al variare del punto x considerato 
e quindi, contrariamente a quanto succedeva nel caso degli spazi standard R”, 
C” o P”, non possiedono alcun carattere globale. Inoltre non si è neanche sicuri 
di poter spostare differenziabilmente un sistema di riferimento tangente lungo 
M. Infatti, ciò equivarrebbe a dire che su M è possibile costruire n campi dif- 
ferenziabili di vettori tangenti linearmente indipendenti in ogni punto x di M 
e ciò implicherebbe che il fibrato tangente TM+ M di M fosse trivializzabile 
cioè diffeomorfo a un prodotto diretto M x R”. Allorché TM è trivializzabile, 
si dice che MM è parallelizzabile. È eccezionale che una varietà differenziabile 
sia parallelizzabile. Si sa per esempio che le sole sfere parallelizzabili sono 51, 
53, 5? (teorema di Bott-Kervaire-Milnor: cfr. l'articolo « Locale/globale »). 

Il fatto però che M non sia in generale parallelizzabile non vieta di spostare 
i riferimenti tangenti su MM. Spostando un sistema di riferimento su M lungo 
un cappio, si può ritornare al punto di partenza con un riferimento differente. 
In altri termini, si può considerare il fibrato dei riferimenti su M e, anche se 
esso non ammette sezioni globali, considerarne delle sezioni, rilevando su di esse 
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cammini di M. La coomologia di tale fibrato è determinante per la coomologia 
di M a valori nei fibrati vettoriali, punto di vista che sviluppa la teoria dei fibrati 
principali inaugurata da Cartan nel suo metodo detto del (sistema di) riferimen- 
to mobile. 

L’uso delle coordinate locali è ineliminabile in geometria differenziale e 
riemanniana. Esso sta alla base di tutti i calcoli e permette di definire delle en- 
tità cosi importanti quali la curvatura di una varietà, la parentesi di Lie di due 
campi vettoriali, l’azione di una connessione affine, ecc. (cfr. «Invariante» e 
«Relatività »). Tuttavia, poiché la geometria di una varietà è intrinseca, cioè in- 
dipendente dalle coordinate locali scelte, bisogna sempre presentarne i risultati 
in modo invariante. Le coordinate locali servono ad esprimere e a calcolare, ma 
devono poter essere eliminate. 


4. Cambiamento di riferimento, invarianza e relatività. 


Il fatto che in uno spazio nel quale nessun punto è fenomenologicamente 
distinguibile (cioè in uno spazio privo di punti di riferimento) non ci si possa 
riferire che mediante un sistema di coordinate, che un tale sistema sia arbitra- 
rio e che perciò gli enti derivati da tale spazio debbano aver senso a prescin- 
dere dalla scelta del sistema di riferimento, è un’evidenza a priori tra le più fe- 
conde di tutta la matematica e soprattutto di tutta la fisica. È anzi doveroso 
notare che in fisica questa evidenza possiede lo statuto di un autentico principio 
a priori dell'esperienza che è determinante per l’oggettività fisica e per la struttu- 
ra dei suoi oggetti. Questo fatto non è sufficientemente ricordato, eppure esso è 
epistemologicamente decisivo poiché mostra che la fisica ha confermato, al di 
là di ogni attesa, il profondo significato dell’apriorismo kantiano. Si tratta, a 
parere di chi scrive, di un’osservazione essenziale per una rivalutazione dei rap- 
porti tra la scienza e la filosofia critica. L’apriorismo kantiano non dev'essere 
interpretato come un assoluto d’origine logica ma come un condizionamento 
dell’esperienza possibile. Esso ha la funzione di dedurre alcune intuizioni dei 
principî sintetici dell’esperienza il cui sviluppo matematico permette di assor- 
bire progressivamente la descrizione dei fenomeni. In altre parole, tale funzione 
non è per nulla incompatibile con l’esperienza, anzi: essa concerne il ruolo della 
matematica nella teoria e consiste nell’assegnare a quest’ultima una finalità (una 
teleologia) che non è quella di una semplice modellizzazione ma di un’identifica- 
zione progressiva della matematizzazione dell'esperienza con lo sviluppo matema- 
tico del suo inquadramento a priori [cfr. Petitot 1980; nonché « Categorie/catego- 
rizzazione» e « T'eoria/modello »]. L’apriorismo kantiano è dunque inscindibile 
dallo sviluppo concettuale della matematica. 

Questa teleologia razionale dell’identificazione dell’oggettività con lo svilup- 
po matematico del suo inquadramento a priori è forse più che mai manifesta 
nella storia del principio di relatività. Si deve dunque richiamarne brevemente 
qualche elemento e ciò sarà fatto partendo dall’ottica generale dell’invarianza 
per cambiamenti di riferimento. 
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4.1. Cambiamenti di riferimento e gruppi di Lie. 


La classe dei sistemi di riferimento di uno spazio astratto £ definisce una 
struttura geometrica su E. I cambiamenti di riferimento entro questa classe co- 
stituiscono un gruppo, il gruppo invariante della struttura e, a partire dal pro- 
gramma di Erlangen di Klein, si definisce una geometria mediante il suo gruppo 
invariante e le proprietà intrinseche degli enti di questa geometria sono le pro- 
prietà invarianti rispetto a tale gruppo. 

Si è stati dunque condotti in modo naturale ad analizzare la struttura gene- 
rale dei gruppi di cambiamenti di riferimento e in particolare la struttura dei 
gruppi classici dei cambiamenti di base negli spazi vettoriali (gruppi lineari), 
delle isometrie negli spazi euclidei (gruppi ortogonali), o degli automorfismi di 
spazi complessi o simplettici (gruppi unitari o gruppi simplettici). Questi gruppi 
hanno doppia struttura. Da un lato sono gruppi (struttura algebrica) e dall'altro 
sono varietà algebriche, analitiche o più generalmente differenziabili (struttura 
geometrica). Costituiscono l’oggetto della teoria detta dei gruppi di Lie, teoria 
sviluppata essenzialmente da Lie, Klein, Killing e soprattutto Cartan; si tratta 
senza dubbio di una delle teorie più complete ed estetiche della matematica 
(cfr. «Invariante»). 

In fisica la struttura del gruppo d’invarianza dello spazio-tempo diventa de- 
terminante di oggetti nel senso già visto a proposito dell’apriorismo kantiano. 
In fisica si considerano non solo i cambiamenti di riferimento geometrici e sta- 
tici, ma anche quelli dinamici, cioè quei riferimenti che si spostano gli uni ri- 
spetto agli altri. In relatività galileiana-newtoniana si suppone che lo spazio- 
tempo è sia il prodotto di uno spazio euclideo tridimensionale e di un asse dei 
tempi (tempo universale). Tra tutti i riferimenti possibili di &, si ammette che 
esista una classe I, la classe dei sistemi di riferimento detti inerziali, rispetto a 
cui le leggi della fisica possono esprimersi in modo invariante. Se R è un ele- 
mento di I, tutti gli elementi di 9 si ottengono sia per cambiamenti geometrici 
(traslazioni nel tempo, traslazioni e rotazioni nello spazio) sia per traslazioni di 
velocità uniforme (cfr. « Relatività»). Sia G il gruppo detto di Galileo dei cam- 
biamenti di riferimento inerziali. Le leggi della fisica devono essere invarianti 
rispetto all’azione di G e ciò impone loro vincoli fortissimi. 

La forza miracolosa della fisica fondamentale risiede in gran parte nel fatto 
ch’essa ha saputo stabilire una solidarietà tra la struttura del gruppo d’invarian- 
za dinamica dello spazio-tempo e alcuni attributi e proprietà fondamentali della 
materia. Infatti, all’invarianza per traslazioni nello spazio sono associati l’im- 
pulso di una particella e la sua conservazione, all’invarianza per rotazioni sono 
associati il suo momento cinetico e la sua conservazione, all’invarianza per tra- 
slazioni nel tempo sono associate la sua energia e la sua conservazione. Si sa 
d'altronde che la relatività ristretta einsteiniana ha avuto origine dalla constata- 
zione che le equazioni di Maxwell per il campo elettromagnetico non erano in- 
varianti per il gruppo di Galileo. Il loro gruppo d’invarianza è il gruppo delle 
trasformazioni di Lorentz. Guidato da un profondo senso dell’a priori del prin- 
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cipio di relatività, Einstein è stato condotto a fare di questo gruppo d’invarian- 
za dell’elettromagnetismo il gruppo d’invarianza di tutta la fisica e dunque in 
particolare della meccanica. La celebre equivalenza tra massa ed energia non è 
che una conseguenza diretta del cambiamento del gruppo d’invarianza, ossia del- 
la geometria di & (cfr. l’articolo « Relatività»). 

In generale, se G è il gruppo d’invarianza dello spazio-tempo é, la struttura 
geometrica di questo gruppo diventa determinante per quelle che prendono il 
nome di particelle elementari di questo spazio-tempo, cioè per la meccanica 
quantistica che è ad esso associata. Infatti, in meccanica quantistica un sistema 
viene rappresentato mediante lo spazio H (che, per ragioni di carattere gene- 
rale, si può supporre essere uno spazio di Hilbert) delle sue funzioni d’onda. 
È peraltro a priori evidente che, poiché la scelta di un sistema di riferimento 
è relativa (concerne l’osservatore e non il sistema), il gruppo G deve operare 
su H. In altri termini, H è una rappresentazione di G. Dire che il sistema è 
elementare equivale dunque a dire che tale rappresentazione è irriducibile. La 
teoria delle rappresentazioni irriducibili di G (eventualmente esteso mediante 
gruppi di simmetrie interne) diventerà dunque :/ principio di classificazione delle 
particelle elementari (cfr. « Particella» e «Simmetria»). Si vede allora che mentre 
in partenza era evidente, il principio di relatività è divenuto costitutivo per la strut- 
tura della materia. Solo nell’atomismo greco in cui gli atomi sono concepiti come 
la manifestazione dei sottogruppi finiti (irriducibili a sottogruppi di rotazione 
del piano) del gruppo di rotazione di R$, si ritrova l’idea che le simmetrie dello 
spazio-tempo determinano la struttura degli oggetti che vi evolvono, cioè, più 
in generale, che un principio di relatività del sistema di riferimento è ontolo- 
gicamente costitutivo, 


4.2. Campi tensoriali, covarianza e relatività generale. 


Quando si considerano varietà differenziabili, per cui la nozione di riferi- 
mento vale solo localmente come riferimento tangente, il principio d’invarianza 
per cambiamenti di riferimento diventa un principio di covarianza per cambia- 
menti di coordinate locali. 

Sia x un punto di una varietà differenziabile M di dimensione x e (x, ..., %,) 
un sistema di coordinate locali in x (x ha dunque come coordinate (0, ..., 0) € 
può essere notato o). Sia C una curva differenziabile di /M passante per x. In 
termini di coordinate locali, C è definita da equazioni parametriche x;= @;(t), 
ove le ©, sono funzioni differenziabili della variabile reale # soddisfacenti per 
esempio a g;(0)=o. Il vettore tangente v a C in x ha come coordinate i numeri 


Se ora si fa un cambiamento di coordinate locali considerando delle funzio- 
ni differenziabili x{=x{(x,, ..., x,) che inducono un automorfismo lineare del 
piano tangente 7,/V (cioè soddisfano alla condizione d’invertibilità che lo jaco- 
biano 7=(dx;/dx;)(0) sia non nullo), la curva C' sarà definita dalle equazioni 
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xisdi(1)=xi(p1 (2), ..., @2(t)). Il vettore tangente v a Cin x avrà dunque per 
coordinate i numeri 


j=1 dx; 31 dx; 


Si denoti ad il numero (dx// dx;)(0). Utilizzando la regola della somma degli in- 
dici, si ottengono dunque le espressioni 


(2) Xi=aiX,. 


Ma il vettore tangente v ha un'esistenza intrinseca indipendente dalla scelta 
delle coordinate locali. Le relazioni (2) di trasformazione delle coordinate di v 
per cambiamento di coordinate locali esprimono proprio tale esistenza intrin- 
seca. Esse la esprimono determinando un tipo di variazione di queste coordi- 
nate, cioè una varianza. Si è dunque condotti ad affermare che ogni sistema 
di n numeri X1) +++, %, Che si trasforma mediante la regola di trasformazione (2) 
per cambiamento di coordinate locali, definisce un oggetto che ha uguale va- 
rianza delle coordinate di un vettore tangente ad M. Si dirà che un tale sistema 
è un tensore controvariante d’ordine I în x. 

Ma le coordinate X; di v sono le coordinate relative a un riferimento in 
T x! canonicamente associato alla scelta (x, ..., x,) di coordinate locali. Per de- 
finire questa base la cosa più semplice è considerare v come un operatore di de- 
rivazione sulle funzioni differenziabili su M (cfr. « Differenziale» e « Infinitesi- 
male»). Se f è una tale funzione, allora l’azione di v è definita dalla formula 


A asta 


La base di 7,,M rispetto alla quale sono definite le coordinate X; di v è dunque 
definita dagli n operatori (d/dx;) = d'. Questi operatori hanno una varianza che 
non è quella di un vettore tangente. Si operi infatti un cambiamento di coor- 
dinate locali. In base alle regole di differenziazione, si ha: 


df _& df dx; 5 « Lx, 
PRA ASSI) è g'i- Idi 
Mi <afà og (ARR 


Si denoti fi il numero (0x;/dx;). Le relazioni (4) diventano le relazioni (5): 
(5) d'— pjò). 


La base dò’ ha dunque una varianza duale di quella di v. Si dice ch’essa è la 
varianza di un tensore covariante d’ordine r în x. 

Il fatto che la varianza di (ò') sia duale di quella di (X,) permette allora 
facilmente di esprimere l’invarianza di v. Si ha infatti v=X;ò'. Per cambia- 
mento di coordinate locali v è trasformato in v' = X{d'i= af X fidi in virtà del- 
le (2) e (5). Si ha dunque = aiBixX,dî. Ma «ÎBj=1 poiché la matrice (Bi) è 
l’inversa della matrice jacobiana (x) e, poiché Xjdi=o, si ha v=v: v è inva- 
riante. 


Sistemi di riferimento 1056 


Si consideri ora la base (dx, ..., dx,) dei differenziali in x, cioè la base dello 

spazio cotangente T*M. Sempre grazie alle regole di differenziazione si ha 

, dx 
dx = Z 3, dx;, 

cioè dxt= aÎdx;. La base (dx;) è dunque un tensore controvariante d’ordine I 
in x, ossia un sistema avente la stessa varianza delle coordinate di un vettore 
tangente. Ciò implica che l’entità d°dx, è un’entità invariante. Tale entità è 
molto semplicemente l’operatore d= didx; che fornisce il differenziale di una 
funzione f secondo la regola df=(df/dx;) dx; 

Sia ora w=a'dx; una 1-forma differenziale in x, cioè un elemento dello 
spazio cotangente 7#/M. Il sistema degli (a;) è un tensore covariante d’ordine 1. 
Si può dunque costruire un’entità invariante considerando la somma a'X,; ove 
(X;) è il sistema delle coordinate di un vettore tangente v. Ma © è una forma 
lineare su 7°,/M e questo numero invariante non è altro che il valore ©(v) di 
su ©. 

Si può notare che in tal modo si definisce la varianza di due tipi di enti, 
quelli di tipo «sistemi di coordinate» come (X;) oppure (a°) e quelli di tipo 
«base (di uno spazio vettoriale di enti) associata alla scelta di un sistema di 
coordinate locali» come (ò’) oppure (dx;). Se (X) è un sistema del primo tipo 
e (0) un sistema del secondo tipo che sia di varianza duale, allora Xx è un’en- 
tità invariante (come v= X;d' 0 w=a'dx;). Se (X) è un sistema del primo 
tipo e (a) un sistema del primo tipo ma di varianza duale, Xa è un numero 
invariante (come per w=a°dx;, v=X;d' e 0(v)=X;a°). Se y è un sistema 
del secondo tipo e « un sistema del secondo tipo ma di varianza duale, allora 
ya è un operatore invariante (come per d= d'dx;). 

Si vede dunque che sulle varietà differenziabili la nozione di cambiamento 
di riferimento fa sorgere tipi di varianza e mediante ciò crea entità invarianti, 
cioè oggetti. Tali oggetti sono i tensori. Ad ogni punto x di M si può dunque 
associare un’algebra tensoriale. 

Un tensore può però evidentemente variare con x. Si è dunque condotti a 
considerare campi tensoriali su M, cioè sezioni dei fibrati vettoriali su M le 
cui fibre sono gli spazi di tensori di un certo tipo. In analogia al calcolo diffe- 
renziale sulle funzioni, si può anche sviluppare un calcolo differenziale sui ten- 
sori. Ma il problema è un po’ più complicato in quanto, se a un tensore si appli- 
cano le regole classiche di differenziazione, non si ottiene, in generale, un tensore. 

Si consideri per esempio una funzione f : M+R. Sia (x,, ..., x) un sistema 
di coordinate locali in xe M. Le derivate parziali (df/dx;) di f sono le coordi- 
nate di un tensore covariante d’ordine 1, che per prodotto con un tensore con- 
trovariante d’ordine 1 (X;), dà lo scalare Xf= X;(0df/dx,) che è la derivata di f 
rispetto ad X. Ma è facile vedere che le derivate seconde (ò’f/dx;dx;) non sono 
le coordinate di un tensore. Poiché anche le derivate d’ordine superiore di una 
funzione non possono essere definite in modo invariante, si è stati condotti ad 
introdurre la nozione di getto (cfr. «Locale/globale » e « Geometria e topologia »). 

Per poter elaborare una teoria invariante della differenziazione dei tensori, 
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bisogna introdurre la nozione di connessione affine e sviluppare la teoria della 
derivazione covariante (cfr. « Relatività»). 

Se si ritorna ora alla relatività einsteiniana, si vede che essa riposa intera- 
mente sui seguenti principî, alcuni dei quali sono puramente a priori, mentre 
altri dipendono solo da dati sperimentali di basilare importanza: 


1) Lo spazio-tempo & è una varietà differenziabile: dato intuitivo fonda- 
mentale. 

2) Questa varietà è a quattro dimensioni: dato intuitivo fondamentale. 

3) In & esiste la possibilità di misurare; è dunque una varietà riemanniana: 
dato pratico primitivo. 

4) Gli enti fisici devono essere descritti da entità di varianza ben definita (e 
dunque da campi tensoriali) dalle quali si possono dedurre entità inva- 
rianti (principio a priori). 

5) Localmente & ammette il gruppo di Lorentz come gruppo invariante 
(principio di relatività). 

6) Vi è un’equivalenza tra massa gravitazionale e massa inerziale (esperien- 


za cruciale) e dunque tra gravità ed inerzia (principio di relatività gene- 
rale). 


Nell'articolo «Relatività» o nel classico Gravitation di Misner, Thorne e 
Wheeler [1973], si vedrà lo sviluppo che, sebbene classico, continua ad affasci- 
nare per il suo contenuto teorico, dell'idea fondamentale che l'equivalenza de- 
gli osservatori (cioè l’invarianza per cambiamenti di sistema di riferimento e di 
coordinate locali) è costitutiva della struttura dell’universo. 


5. Sistemi di riferimento adattati. 


Dati uno spazio £ e una certa entità dipendente da tale spazio, è spesso 
utile considerare dei riferimenti o delle coordinate locali in E adattate all’en- 
tità in questione. Ciò permette infatti di descrivere tale entità in maniera par- 
ticolarmente semplice. In matematica esistono un’enorme quantità di proce- 


dure di questo tipo. Ci si limiterà a citare brevemente quattro esempi di natura 
molto diversa. 


5.1. Sistemi di riferimento adattati in geometria differenziale. 


Dati una curva piana C' e un punto x di C, si può considerare il sistema di 
riferimento costituito dalla tangente e dalla normale a C in x. Se .S è una su- 
perficie in R3 e x un punto di S, si può analogamente considerare il riferimento 
costituito dalla normale in x a S e, nel piano tangente a S in x, gli assi princi- 
pali della conica che descrive la curvatura (cfr. «Differenziale »). 


ti 
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5.2. Sistemi di riferimento adattati in algebra lineare. 


Sia E uno spazio vettoriale di dimensione x e « un endomorfismo di E. È 
noto che l’analisi spettrale di u consiste nel cercare una base di £ in cui l’espres- 
sione di v (la sua matrice) diventi il più semplice possibile. Si può dunque par- 
lare di base «adattata» ad u. 

Similmente, se A è la matrice di una forma quadratica, la ricerca degli « as- 
si principali» è la ricerca di una base adattata ad A. 

Questo procedimento può essere generalizzato agli spazi vettoriali di fun- 
zioni ed agli operatori lineari che sono gli operatori integro-differenziali. La ri- 
cerca di riferimenti adattati ad alcuni di questi operatori diventa allora la ricer- 
ca di funzioni particolari, come le funzioni trigonometriche e le funzioni spe- 
ciali (cfr. « Spettro»). 


5.3. Sistemi di riferimento adattati in teoria delle singolarità. 


Sia f:M4+R una funzione differenziabile a valori reali definita su una va- 
rietà differenziabile di dimensione n. Sia x, un punto critico non degenere di 
f (cfr. «Locale/globale»). Il teorema di Morse dice che esiste un sistema di 
coordinate locali (x, ..., x) in xy (ivi x ha dunque coordinate (0, ..., 0)) tale 
che f assuma la forma particolarmente semplice 


vr n 
 S®)=f(x)-Yai+ Y 

1 jar41 
(il numero 7 di termini quadrati preceduti dal segno negativo è l'indice del pun- 
to critico). Tale risultato significa due cose. Da un lato che mediante un cam- 
biamento di coordinate locali si possono annullare, nello sviluppo di Taylor di 
fin x, tutti i termini di grado =2 (in un punto critico non degenere f è de- 
terminata dal suo getto di ordine 2). Inoltre che, poiché la hessiana di f in x 
è di rango massimo, è possibile, mediante un cambiamento lineare di coordi- 
nate, assumere come sistema di riferimento il sistema dei suoi «assi principali». 

In generale, dato un punto singolare di un’applicazione f:M4+N tra due 

varietà differenziabili, si cercheranno sistemi di coordinate locali sia nel domi- 
nio M sia nel codominio N per cui l’espressione di f diventi Ia più semplice 
possibile. Il teorema di Whitney sui modelli canonici delle singolarità delle ap- 
plicazioni differenziabili strutturalmente stabili tra varietà di dimensione 2 ne 
è un tipico esempio. 


5.4. Variabili azione-angolo in meccanica hamiltoniana. 


In meccanica hamiltoniana (cfr. in particolare « Geometria e topologia», VI, 
PP. 7713-23) è dato uno spazio delle fasi munito d’una struttura simplettica, cioè 
una varietà differenziabile E di dimensione pari 22 munita di una 2-forma dif- 
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ferenziale chiusa e regolare +. In generale E sarà il fibrato cotangente di una 
varietà di configurazione M. 
Per il teorema di Darboux, se x e £, esistono sempre dei sistemi di coordi- 


nate locali di tipo (?, 9), 9= (4, +14) € P=(P ---, Pr) per cui © prende la 


w 
forma standard @= )' dp; A dg;. Tali sistemi «adattati» a © si chiamano siste- 


mi di coordinate simplettiche e i cambiamenti di coordinate simplettiche si chia- 
mano trasformazioni canoniche. Si tratta delle trasformazioni che lasciano in- 
variante la 2-forma ©. 

È noto che un sistema hamiltoniano è allora definito da uno hamiltoniano 
su M cioè da una funzione «energia» H : -M-+R (differenziabile). Ad H viene 
associata la 1-forma dH che è il suo differenziale. Ma la 2-forma © stabilisce 
un isomorfismo tra vettori tangenti e vettori cotangenti di E e si può dunque, 
tramite @, associare a 4H (e dunque ad 7) un campo di vettori su £, detto 
flusso hamiltoniano, le cui traiettorie sono date dalle equazioni canoniche di 
Hamilton: 

da dèH dp dH 
dt òp di dg 


Per costruzione, la 2-forma w è invariante per l’azione del flusso (e dunque 
anche w” che è la forma «volume» di E: teorema di Liouville); cosi pure lo è 
lo hamiltoniano H (conservazione dell’energia). 

Per cercare d’integrare le equazioni di Hamilton riportate sopra, il proce- 
dimento consiste nel cercare integrali primi ossia invarianti del flusso indipen- 
denti da © e da H. Infatti esiste un teorema fondamentale, dovuto a Liouville, 
che afferma che se si conoscono n—1 integrali primi (cioè #—1 funzioni 
F,:E+R le cui parentesi di Poisson (F;, H) con lo hamiltoniano H sono 
identicamente nulli) i quali, da un lato sono tra loro indipendenti ed indipen- 
denti da 7 (cioè tali che in ogni punto x di £ i differenziali dF; e dH siano 
linearmente indipendenti) e dall’altro sono tra loro în involuzione ed in involu- 
zione con /H (cioè tali che le parentesi di Poisson (F;, F}) c (F;, H) siano iden- 
ticamente nulle), allora le equazioni di Hamilton s’integrano per quadrature. 

Più precisamente, se le condizioni del teorema di Liouville sono soddisfat- 
te, se 4=(2,, ..., 4,1) è un sistema di valori per le F;, e se e è un valore di 
H, il sottoinsieme V,,, di E definito da H=e e F;=a; (i=1,...,n—1) è un 
sottoinsieme invariante rispetto al flusso hamiltoniano. Poiché le F, e H sono 
indipendenti, V,,, è in effetti una sottovarietà regolare di E. Se per di più essa 
è compatta e connessa, considerazioni di natura puramente geometrica impli- 
cano ch’essa è diffeomorfa a un toro n-dimensionale 7. Il moto su 7 è allora 
quasi periodico, il che significa che, se (7, ..., ©) sono le coordinate angolari 
di 7, le equazioni di Hamilton si riducono a dp/dt= 0, ove Q è una n-pla 
che dipende da a e da e. 

Un tale sistema avente x integrali primi (tra cui H) indipendenti e in invo- 
luzione si chiama sistema integrabile. Si può allora mostrare che in un intorno di 
V.,er E è un prodotto diretto di V, , (cioè di T) per un aperto U di R”. Si ha 
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dunque un sistema di coordinate (0, ©) in cui le equazioni di Hamilton si scri- 
vono dp/dt=Q, d0Q/dt=0, e s’integrano dunque immediatamente ottenendo 
Q= cost e p(1)=9(0)+02#. Tali coordinate non sono in generale simplettiche. 
È però possibile trovare altri integrali primi Z;, funzioni delle F,, tali che le 
coordinate (/, ) siano simplettiche. Le coordinate simplettiche (/, ©) si chia- 
mano variabili azione-angolo [cfr. Arnold 1974]. Se le coordinate simplettiche 
sono «adattate» alla 2-forma © che definisce la struttura simplettica di E, le 
variabili azione-angolo sono coordinate simplettiche «adattate» allo hamilto- 
niano ZH. 


6. Sistemi di riferimento e classificazioni. 


I pochi, drammaticamente lacunosi richiami che precedono, mostrano la 
straordinaria «fecondità » delle nozioni di sistema di riferimento e di coordina- 
te. Esse hanno però preso origine da una situazione in cui lo spazio di base con- 
siderato è omogeneo, cioè privo di punti di riferimento. Ora, com'è stato notato, 
il problema del sistema di riferimento si pone anche in spazi «eterogenei », ossia 
marcati o contrassegnati. Fino ad ora questo aspetto del problema del riferimen- 
to era rimasto estraneo alla matematica. Per concludere, si desidera fare una 
breve osservazione sulla recente presa di coscienza di tale problema. 

Un metodo radicalmente diverso di riferire un oggetto è quello di riferirlo 
non allo spazio ma agli oggetti di ugual natura. Il paradigma ora non è più 
quello di un osservatore di fronte all’omogeneità dello spazio ma è quello della 
classificazione. Si tratta del paradigma dello strutturalismo. Esso consiste nel 
dare una posizione a un’entità in uno «spazio strutturale», cioè uno «spazio » 
categorizzato in classi mediante un sistema di differenze, di soglie, di scarti 
differenziali (cfr. « Sistematica e classificazione»). Se gli enti considerati sono 
discreti, tale paradigma si sviluppa in teorie logico-combinatorie. Ma se questi 
enti dipendono da parametri continui, la situazione cambia radicalmente. Il con- 
cetto di classificazione acquista un contenuto geometrico e diventa suscettibile 
di un’analisi geometrica profonda dalla quale la teoria delle catastrofi ha tratto 
nuove possibilità di modellizzazione. 

Si ricordino dunque (in riferimento all’articolo «Locale/globale ») alcune 
prerogative del paradigma catastrofista. Si considerino «forme» descrivibili in 
termini di applicazioni f: M-+N tra due varietà differenziabili. ’I'ali «forme» 
costituiscono uno spazio funzionale }. Questo spazio è intrinsecamente eteroge- 
neo. Infatti è naturale considerare che due forme f e g siano equivalenti, che 
esse abbiano lo stesso tipo differenziabile, se si può passare dall’una all'altra 
mediante cambiamenti di coordinate nel dominio (147) e nel codominio (N) o, in 
altri termini, se esistono un diffeomorfismo @ di e un diffeomorfismo Y di 
N tali che si abbia g=V0fo gp. In questa definizione di equivalenza entra 
in gioco il principio di relatività del riferimento negli spazi M ed N. È però 
essenziale notare che l’uso del principio di relatività del riferimento implica che 
il problema del riferimento stesso si pone in modo totalmente diverso in 5. In- 
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fatti, F essendo munito della topologia adeguata alla struttura differenziabile, 
è possibile definire le forme strutturalmente stabili di $ come le forme f che am- 
mettono un intorno di forme g tutte equivalenti ad f. Se U è l’aperto di $ 
composto di forme stabili, il chiuso ad esso complementare K — detto insieme 
catastrofico globale di $ — è un sottospazio di 3 classificante i tipi stabili. Tale 
insieme catastrofico K essendo inerente ad 3 (intrinseco), il problema del rife- 
rimento in 5 diventa duplice: 1) dare una posizione agli elementi di 3 rispetto 
a K (aspetto puramente qualitativo del riferimento); 2) data una classe V defi- 
nita da X, dare una posizione agli elementi di V in V mediante l’uso di coor- 
dinate (aspetto quantitativo del riferimento). 

Nei modelli trasversi delle singolarità di tipo catastrofi elementari, va sot- 
tolineato (cfr. « Locale/globale ») il carattere «misto » tra l’aspetto qualitativo del 
riferimento (basato sulla morfologia di K e sul modo con cui separa lo spazio) 
e l'aspetto quantitativo del riferimento stesso (basato sull’uso delle coordinate). 


[.P.]. 
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La ricognizione antropologica (cfr. anthropos) della rappresentazione dello spazio 
nelle diverse culture (cfr. cultura/culture) — in particolare nelle società primitive (cfr. 
primitivo) ove lo spazio è locale (cfr. locale/globale) e simbolicamente (cfr. segno, 
simbolo) scandito dall’opposizione/contraddizione di sacro/profano — e l'indagine 
della genesi psicologica delle nozioni spaziali e del loro apprendimento mettono in luce 
la rilevanza dei sistemi di riferimento nella modellizzazione (cfr. modello) del reale. 
La ricerca di un punto di riferimento in un viaggio sugli oceani o nella costituzione delle 
varie cosmologie (slittate progressivamente dall’astrologia all'astronomia), l’analisi 
della spazialità pittorica con gli studi sulla prospettiva (cfr. disegno/progetto), le varie 
raffigurazioni della terra che via via vengono approntate dalla cartografia (cfr. atlante) 
sono tutte alla base della nozione moderna di sistema di riferimento che con Descartes e 
Leibniz è venuta svolgendo un ruolo chiave per le matematiche, consentendo l’artico- 
lazione sistematica dello studio delle varie funzioni, la nascita del moderno punto di vista 
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differenziale, rilevanti sviluppi del calcolo stesso (cfr. anche infinitesimale). Con i 
grandi progressi dell’astrazione matematica (cfr. astratto/concreto) dell'Ottocento, in 
particolare con la rottura concettuale promossa da Riemann, la considerazione di spazi 
generalizzati costituiti da entità qualsiasi dipendenti da un numero finito o infinito di pa- 
rametri ha potenziato in modo formidabile lo studio — in chiave di geometria e topolo- 
gia - di moltissimi problemi matematici. Nel contesto della fisica ha contemporanea- 
mente preso corpo la definizione degli oggetti fisici come invarianti (cfr. invariante) ri- 
spetto ai cambiamenti di riferimento, al punto che l’esigenza che una legge fisica non di- 
penda da un particolare sistema (scelto in modo arbitrario, dunque convenzionale; cfr. 
convenzione) è stata incorporata nelle teorie fisiche di base (cfr. teoria/modello) come 
la relatività (cfr. anche spazio-tempo) e i quanti (cfr. anche conservazione/invarian- 
za e per altri aspetti particella). Ma se enormi progressi intellettuali si sono compiuti 
nell’analisi dei sistemi di riferimento per spazi omogenei, anche gli spazi eterogenei pos- 
sono venir contrassegnati dagli opportuni « riferimenti » mediante un sistema di scarti dif- 
ferenziali, di soglie (cfr. soglia). Si ritrova cosi l’antico problema della sistematica e 
classificazione: quando le entità considerate sono discrete (cfr. continuo/discreto) 
questo paradigma si sviluppa in una combinatoria logico-linguistica (cfr. logica, 
linguaggio e anche codice, immagine); se invece dipendono da parametri continui, la 
classificazione acquisisce un carattere geometrico, come è nei casi modellizzati dalla teoria 
delle catastrofi. 


Stabilità/instabilità 


1. diversi aspetti del problema. 


Non esiste una definizione rigorosa di stabilità che comprenda tutti i casi 
in cui questa parola è usata nella ricerca scientifica contemporanea. Nei lavori 
dei matematici si trovano invece molte definizioni — nel senso molto preciso che 
il termine ‘definizione’ ha nella matematica contemporanea — di stabilità, di 
solito distinte tra loro da aggettivi, come per esempio ‘stabilità orbitale, asin- 
totica, strutturale, numerica, assoluta, ecc.” oppure dal riferimento a un autore: 
‘stabilità di Lagrange, di Ljapunov, di Andronov-Pontrjagin, di Thom, ecc.’. 
Nei lavori dei fisici e degli ingegneri si trova invece spesso una nozione di sta- 
bilità non pienamente formalizzata, specificata di volta in volta da espressioni 
del tipo «stabilità rispetto alle piccole perturbazioni dei dati xyz». 

L’unico metodo conosciuto per ricondurre ad unità le svariate decine di 
definizioni diverse, che compaiono nei più disparati ambiti della matematica 
pura ed applicata, è quello di ricorrere a una definizione di stabilità/instabilità 
di carattere metamatematico. È necessario che il lettore sia avvertito del fatto 
che i ragionamenti metamatematici di questo tipo, portati avanti da Thom e dal- 
la sua scuola (cfr. del resto le osservazioni finali dell’articolo « Matematiche» in 
questa stessa Erciclopedia, VIII, pp. 873-75), non sono affatto bene accetti a 
tutta la comunità scientifica. Eppure sembra che sia ormai tempo di far uscire 
questo dibattito dagli ambiti specialistici, non solo perché con le definizioni 
«alla Thom» si sono ottenuti risultati ormai cosi importanti da costituire pra- 
ticamente una branca nuova della matematica pura ed applicata, ma soprat- 
tutto perché non sono state proposte serie alternative al tentativo di unifica- 
zione della nozione di stabilità fatto dalla scuola «catastrofista», se non quella 
di restare nella Babele precedente. Certo i ragionamenti di questo tipo hanno 
un prezzo, che molti trovano eccessivo: quello di mettere in risalto più ciò 
che non si sa, i problemi aperti, i metodi scorretti ed illegittimi che si usano e 
non si riescono a correggere, di ciò che si sa ed è « sistemato» in modo soddi- 
sfacente. Questo prezzo — è bene che sia subito chiaro — sarà pagato anche in 
questo articolo. 

In sintesi, una definizione matematica di stabilità/instabilità potrebbe es- 
sere questa: una proprietà definita nell’ambito di una struttura matematica è 
una proprietà di stabilità o instabilità se essa individua, in senso positivo o 
negativo, l'attitudine di un oggetto matematico della struttura stessa ad essere 
eventualmente impiegato in qualche modo come modello della realtà. 

Per evitare equivoci metafisici è bene precisare che ‘modello della realtà’ 
viene qui inteso in senso strettamente empirico ed operativo (si veda l’articolo 
«Modello » in questa stessa Enciclopedia). Un modello può essere costituito da 
un'equazione — nel senso generalizzato di relazione tra diverse variabili a valori 
in oggetti di una teoria matematica data — e dall’interpretazione di alcune tra 
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le variabili in gioco come grandezze osservabili. Scelte alcune di queste gran- 
dezze come parametri da determinare con l’osservazione, alcune altre risulte- 
ranno determinate dall’equazione in funzione delle prime, ed i loro valori o pro- 
prietà osservabili saranno le predizioni del modello. Poiché non è detto che 
tutte le variabili in gioco siano osservabili, chiedersi se l’equazione è «in realtà» 
una «legge della natura» oppure solo una simulazione matematica è privo di 
senso in questo contesto; un dato modello può solo essere verificato con l’espe- 
rienza, confrontando le predizioni con le osservazioni. 

Però questa descrizione «ingenua» del rapporto tra esperienza e matema- 
tizzazione è molto diversa dallo svolgimento storico della ricerca scientifica 
nell’età moderna, e la differenza principale è proprio il problema della stabilità. 
Poiché i dati «osservati» sono il risultato di misure sperimentali e di manipola- 
zioni matematiche di questi, e perciò non sono mai esatti, ma approssimati per 
il duplice effetto degli errori di misura e delle approssimazioni introdotte per 
semplificare i calcoli. Non solo: l'equazione stessa non è mai un prodotto ar- 
bitrario del nostro intelletto, ma è il risultato di esperienze precedenti: nel caso 
più semplice il modello contiene dei parametri «interni» che non sono misu- 
rati dall’espèrienza in corso, ma sono il risultato di un’esperienza precedente, 
e perciò sono essi stessi noti con un certo margine di approssimazione. Nel caso 
più complicato concettualmente, è la stessa forma matematica del modello (per 
esempio: funzione, cioè equazione in termini finiti; equazione differenziale li- 
neare o non-lineare, a derivate ordinarie o parziali, problemi con dati iniziali o 
al contorno o misti, equazione alle differenze finite ad un passo o a più passi, 
ecc.) che è stata scelta in base alla sua validità dimostrata da esperienze prece- 
denti. Allora a maggior ragione le predizioni del modello sono solo approssimate; 
e l'errore prevedibile nella predizione è l’effetto cumulativo di tutte le approssi- 
mazioni — nelle misure, nei calcoli e nella teoria stessa — insite nel modello. Se 
tale errore prevedibile è abbastanza piccolo, per esempio dell’ordine di gran- 
dezza dell’errore sperimentale nella misurazione della grandezza predetta, al- 
lora il modello è utilizzabile; altrimenti che il modello predica l’esperienza si può 
verificare solo per caso. Ma come si fa a determinare -- o meglio a maggiorare — 
l’errore di predizione? 

Determinare un limite massimo per gli errori di predizione introdotti da 
ciascuna delle approssimazioni dei tre tipi detti — errori di misura, semplifica- 
zioni dei calcoli, schematizzazioni del modello matematico — è il problema della 
stabilità; in particolare il modello sarà stabile se l'errore di predizione dipen- 
derà in modo continuo dalle approssimazioni introdotte, ossia se sarà possibile 
rendere arbitrariamente piccoli gli errori di predizione pur di rendere arbitra- 
riamente precise le misure, i calcoli ed il modello stesso. Se poi queste preci- 
sioni siano raggiungibili in pratica, con i mezzi attuali (per esempio se i tempi 
di calcolo sono ragionevoli usando la generazione attuale di calcolatori), è un 
problema diverso, che si può far rientrare o meno nel termine ‘problema di sta- 
bilità’ (cfr. l'articolo « Calcolo» in questa stessa Enciclopedia). 

Perciò per ogni tipo di modello matematico (equazione in termini finiti, 
equazione differenziale ordinaria o alle derivate parziali, principio variazionale, 
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rappresentazione di gruppo, C*-algebra, varietà riemanniana, equazione alle dif- 
ferenze, alle differenze finite, integrale, integrodifferenziale, ecc.) e per ogni 
tipo di approssimazione introdotta (nei dati iniziali, nei dati al contorno, nei 
parametri interni del modello; errori di arrotondamento, di troncamento nu- 
merico, di troncamento di serie di Taylor, di Fourier, ecc.) si può dare una cor- 
rispondente definizione di stabilità. Non stupisce perciò che tali definizioni 
nella letteratura siano varie decine; anzi sono assai meno di quelle che potreb- 
bero essere, semplicemente perché alcuni problemi di stabilità sono chiaramen- 
te di una tale difficoltà da sfidare l'immaginazione di tutti i ricercatori contem- 
poranei. 

Ma proprio perché la «teoria della stabilità» non è un singolo problema ma- 
tematico ma una collezione potenzialmente infinita di problemi, dei quali solo 
quelli più elementari sono stati studiati, ciò che è caratteristico dei problemi 
di stabilità è che la risposta alla dogunda «Questo modello è stabile?» non è 
mai cosî netta come ci si potrebbe attendere dal risultato di una rigorosa ri- 
cerca scientifica. Il rapporto tra la stabilità e il suo contrario, l’instabilità, è 
sempre dialettico e storicamente determinato dallo stato della ricerca non solo 
matematica ma anche sperimentale. Perché se un modello è instabile rispetto 
a una previsione, che risulta perciò illegittima, può essere stabile rispetto a 
un’altra previsione, di natura più qualitativa, meno precisa: per esempio l’in- 
stabilità stessa può essere stabile, e quindi costituire una previsione legittima: 
questo è il tema della teoria della stabilità pi raffinata, la teoria delle catastrofi 
(cfr. in questa stessa Enciclopedia l'articolo « Locale/globale», in particolare alle 
PP. 45471 del volume VIII). Oppure può aversi stabilità rispetto ad alcune ap- 


prossimazioni e non rispetto ad altre; capita troppo spesso che due tipi diversi - 


di stabilità si escludano a vicenda. Capita perciò che il problema della stabilità 
di un modello sia chiuso e riaperto a più riprese nella storia della scienza per 
effetto di progressi in campi apparentemente molto lontani della ricerca. 

Percorrere questa enorme varietà di teorie e problemi di stabilità non è pos- 
sibile né qui né in alcuna trattazione ragionevole; tuttavia sarebbe inutile prose- 
guire senza fare degli esempi concreti di modelli matematici e di problemi di 
stabilità ad essi collegati, anche se per fare esempi matematicamente non banali 
e storicamente significativi occorre un certo apparato matematico (e qualche 
nozione di fisica). La maggior parte di questo articolo sarà perciò dedicata a 
un solo esempio, la cui storia ormai tricentenaria e la cui complessità matemati- 
ca sono sufficienti ad illustrare una parte notevole dei problemi di stabilità in- 
contrati dalla scienza moderna. 


2. Il problema dei due corpi. 


Forse il più celebre di tutti i modelli matematici del mondo fisico è quello 
che descrive un sistema di corpi celesti — per esempio il sistema solare — come 
corpi che interagiscono tra loro soltanto con la reciproca attrazione gravita- 
zionale, seguendo le leggi di Newton (cfr. del resto in questa stessa Enciclope- 
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dia larticolo «Moto», IX, pp. 596 sgg.). Se i corpi sono puntiformi oppure 
perfettamente sferici, rigidi e omogenei (cioè se si trascura l’effetto dell’asim- 
metria delle loro forme), e si suppone che non vi sia alcun attrito, le equazioni 
differenziali che descrivono il moto dei corpi secondo la teoria newtoniana si 
dicono «problema degli x corpi della meccanica celeste», dove x è un numero 
intero maggiore di 1. 

Si supponga per incominciare che i corpi siano solo due, dei quali uno fisso 
nell'origine O del sistema di coordinate in cui si studia il moto, e l’altro abbia 
una posizione variabile col tempo P= P(#) ma sia vincolato a un piano fisso 
(«problema piano»). Queste ipotesi, che servono alla semplicità dell’esposizio- 
ne, non mutano la natura del problema dei due corpi. Allora la seconda legge 
di Newton dice che l’accelerazione (derivata seconda della posizione P rispetto 
al tempo) sarà proporzionale alla forza esercitata su P da O: F=m(d?P/4dt%). 

Ma poiché tale forza F sarà rivolta verso O (forza centrale) e di grandezza 
inversamente proporzionale al quadrato della distanza r tra P ed O, essa sarà 
esprimibile meglio usando il vettore e, di lunghezza 1 rivolto da O verso P, 
cioè definito da P=re,. Allora si avrà F= —(Mm/r*)e,, dove M è una costan- 
te, e le due espressioni di F uguagliate daranno l'equazione fondamentale del 
modello dei due corpi: 


dP__M 
(1) di 
Pertanto nel piano in cui si svolge il moto è naturale usare un sistema di coor- 
dinate polari r (distanza di O da P) e 3 (angolo della retta OP a una direzione 
fissa). Si tratta ora di dedurre dall’equazione (1) le soluzioni P(#) possibili, 
senza fare uso di altro che della matematica, in particolare delle dai for- 


da 


mali dell’operatore derivata È per esempio la linearità di 7 La dA f+g)= 


dg CO df 
+È, e la formula di Leibniz 37 o) sg Era 
Poiché, al variare di f, e, ruota ma resta di lunghezza 1, la sua velocità è 
parallela al vettore ey ad esso perpendicolare (in senso antiorario) e proporzio- 
nale alla velocità angolare d9/dt: (d/dt)(e,)=(d9/dt)ey. Perciò (per la formula 
di Leibniz), 
“te )= Le PELLA 
di i dI dt 
Poiché anche ey ruota con velocità angolare 4d9/dt, (4/dt)(eg)= —(d8/dt)e, 
e perciò, usando ancora la formula di Leibniz, 
LD e 43148, perda def Ed RO d3° ki 
de di °° dd * dd de \d 
confrontando con l’equazione (1), e separando la componente radiale (cioè pa- 
rallela a e,) e tangenziale (cioè parallela a ey) dell’accelerazione e della forza, 
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si ottengono due equazioni, le quali, considerate nel loro insieme, risultano equi- 

valenti alla (1): 

@) dr (d&°__M 
de "\de 


Li dr dd 429 
3 2 go a 


72 


Si noti che il sistema cosî ottenuto è ancora costituito da due equazioni del se- 
condo ordine (contenenti le derivate seconde); il sistema è perciò di «ordine» 4 
nel senso che le variabili dinamiche (quelle le cui derivate compaiono nelle 
equazioni) sono quattro: 7, 3 e le loro derivate dr/dt, 43/dt. Il passo successivo 
fa uso della nozione fondamentale di integrale primo, indipendente dal tempo, 
vale a dire di una funzione della posizione P(#) e della velocità (4P/dt)(t), 
h(P, dP[dt), tale da assumere un valore che, al variare di # e con esso di P(t), 
(dP/dt)(t), resta costante; cioè 


i (POT) =0. 


Il primo integrale primo fu scoperto (dalle osservazioni) da Keplero ed è l’in- 
tegrale delle aree, o momento angolare 7=7°(49/dt). Infatti 

d} drdè ,d°3 . 

di PrLsd PT (primo membro della (3))=7-o=o. 
Perciò la (3) afferma proprio che 7 è un integrale primo, per ogni moto go- 
vernato da una forza centrale: allora sostituendo la costante 7 a 7?2(493/dt) nella 
(2), il sistema di equazioni diventa 


dr 5 M 
O a A 

dI 3 
O 27 


cioè è stato ridotto all’ordine 3, poiché alla variabile dinamica d9/dt è stata so- 
stituita la variabile non dinamica, costante, lungo una soluzione, 7. 

Un altro integrale primo è l’integrale dell’energia, che si trova per ogni 
equazione della forma (4) in questo modo: si cerchi una funzione V(r), detta 
energia «potenziale», tale che la (4) diventi d2r/dt2= —(4V(r)/dr). V(r) si tro- 
va allora integrando il secondo membro della (4), e risulta V(r)= (72/272) 
—(1M/r) a meno di una costante. Allora 


(6) E=T+ Vai (E) V(r) 


è un integrale primo: 
dE drd°» drdV dr (F 2] 


di didi'didr di\d®' dr 
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Ma allora è possibile abbassare ancora di uno l'ordine del sistema (4) e (5); 
infatti dalla (6) si può ricavare dr/dt: 


mM T-avazro 


e il sistema costituito dalla (7) e dalla (5) ha ordine 2, con due sole variabili 
dinamiche, 7 e 3, e due integrali primi, E e 7, che dipendono dalle condizioni 
iniziali ma non variano col tempo. 

A questo punto si può integrare per quadrature il sistema costituito dalla (5) 
e dalla (7); infatti l'ordine del sistema può essere ulteriormente abbassato di 
uno eliminando la variabile indipendente (il tempo); applicando i teoremi della 
funzione inversa e della funzione composta si trova infatti che se si considera 3 
come funzione di r anziché di # si ha: 


d9 
dg SA e dei 
dr dr © PV2E-2V(r) 

di 


Ora la (8) è un’equazione di ordine 1 a variabili separabili (si veda l’articolo 
«Differenziale» in questa stessa Enciclopedia) la cui soluzione è semplicemente 
data dall’uso dell’operazione inversa della derivazione, cioè dell’integrale 


i 3 ds 
ro SEV2E-2 V(s) 


dove & è una costante d’integrazione. 
In linea di principio la formula (9), accompagnata dall’analoga «quadra- 
tura» che si può ricavare dalla (7) 


i ds 
r, V2E—-2V(s) 


(dove i, è un’altra costante d’integrazione), costituisce una soluzione del pro- 
blema dei due corpi, poiché consente di calcolare — eseguendo gli integrali — le 
funzioni 8=9(7), #=?#(r) e quindi - effettuando un’inversione — r=f1(t), 
9=9(7(1))=fa(t) cioè la soluzione P(t#) come funzione del tempo in coordi- 
nate polari. 

Vale la pena però di osservare che la «quadratura» (9) possiede una forma 
molto particolare, poiché la funzione integranda al secondo membro è abba- 
stanza semplice: allora è possibile esprimere l’integrale (9) jin termini finiti 
mediante la funzione trigonometrica inversa «arco il cui coseno è...» in questo 
modo: 


(9) d-0=+ 


(10) t-bh= + 


(11) d— = +arcos 
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Da questa formula, per inversione (cioè ricavando r in funzione di 8), si ottiene 
la nuova formula 


FM 


Î 2E7? 
It} 1+ me cos(d®— ) 


che è l'equazione — in coordinate polari -- di una sezione conica di eccentricità 
e=(14+2E9°)/M?, cioè un’ellisse per o<e<1; una circonferenza per e=0; una 
parabola per e=1, un ramo di iperbole per e>1. 

Allora la legge della traiettoria (12) assegna la curva su cui si muoverà la 
soluzione P(#), mentre la legge oraria (10) assegna i tempi di percorrenza 
della traiettoria stessa. Si noti che l'equazione (12) (oppure (11)) si può inter- 
pretare come la definizione di un terzo integrale primo ©, indipendente dal 
tempo, w= w(P, dP/dt), mentre la (10) definisce l’integrale primo dipendente 
dal tempo ty=£,(P, dP/dt,t) che è pure costante al variare di #. Perciò la co- 
noscenza di tre integrali primi indipendenti dal tempo E, 7, © e di un quarto 
integrale primo dipendente dal tempo, £,, determina esattamente la soluzione: 
in questo caso poi i tre integrali primi E, 7, © sono noti esplicitamente come 
combinazioni di funzioni elementari, mentre #, è ricavabile solo tramite l’in- 
tegrale (10) di cui non si conosce un’espressione finita mediante funzioni ele- 
mentari. 

Prima di passare a considerare un più complicato problema degli n corpi con 
n>2, conviene soffermarsi un poco sulle straordinarie caratteristiche della so- 
luzione, qui frettolosamente presentata, del problema dei due corpi. La prima 
caratteristica stupefacente di questa soluzione è che il procedimento seguito 
per ottenerla è molto semplice, relativamente all'importanza del problema; tut- 
tavia tale semplicità è solo apparente, perché essa è ottenuta dando per scon- 
tate le proprietà delle operazioni di derivazione e integrazione, cioè di quel cal- 
colo infinitesimale che si fondava, non solo all’epoca di Newton ma ancora 
per tutto il Settecento, su principî incerti e poco accettabili dal punto di vista 
del rigore logico (cfr. su questo aspetto gli articoli « Calcolo», « Differenziale » e 
«Infinitesimale» in questa stessa Enciclopedia), e che ancora oggi costa non 
poca fatica per essere appreso in tutto rigore da chi intraprende studi scientifici. 
Ma l’importanza storica decisiva del problema dei due corpi consiste proprio 
nel fatto che il successo strepitoso ottenuto dalla soluzione di Newton del pro- 
blema (nel predire i risultati osservativi dell’astronomia del sistema solare) 
costrinse gli scienziati - dopo un breve periodo di resistenza — ad accettare i 
procedimenti del calcolo infinitesimale come atti a costituire modelli matematici 
della realtà, malgrado la stessa incertezza dei fondamenti logici, incertezza che 
fu sciolta solo 150 anni dopo da Cauchy e dai suoi successori. In particolare, il 
modello della realtà fisica basato sulle equazioni differenziali ordinarie come la 
(1) — derivate seconde delle posizioni uguali alle forze impresse — s’impose co- 
me il modello matematico della realtà per eccellenza («meccanicismo»). 

Allora ciò che importa mettere in rilievo della soluzione del problema dei 


(12) r= 
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due corpi (che è stato presentato nella forma datagli da Bernoulli nel 1710, 
quando le riserve sul calcolo infinitesimale che avevano imbarazzato lo stesso 
Newton, costringendolo a una presentazione ibrida, potevano ormai essere su- 
perate dagli scienziati più all’avanguardia) è che la ragione principale di tale 
successo nel predire i risultati osservativi è che tale soluzione possiede straor- 
dinarie caratteristiche di stabilità. 

Infatti si supponga che le osservazioni astronomiche diano i valori delle 
«osservabili» posizione e velocità al tempo t=o. (In realtà non è proprio cosi, 
poiché le osservazioni astronomiche forniscono solo posizioni e non velocità; 
a questo caso ci si può però ricondurre con vari metodi, studiati da Laplace, 
Gauss e altri). Da queste è possibile calcolare gli integrali primi E, 7, ©, 4, con 
le formule viste; ora, usando le stesse formule al contrario, dati £, 7, ©, fo è 
possibile calcolare il valore di P(f), e se occorre dP/di, a un tempo arbitrario 
t#0, usando formule esplicite come la (12) e dando soluzioni approssimate ad 
equazioni che contengono integrali come la (10) (o in realtà risolvendo l’equi- 
valente «equazione di Keplero»). Il calcolo della predizione P(#) può essere 
eseguito con la precisione voluta, pur di dedicare un tempo sufficiente — e del re- 
sto ragionevole — ai calcoli. Ora però i parametri da cui dipende la soluzione — 
cioè il parametro M (massa del corpo attirante) e gli integrali primi £, 7, ©, f0- 
sono funzione delle osservabili posizione e velocità iniziali, che sono note solo 
con una certa approssimazione. Si supponga allora che le condizioni iniziali os- 
servate siano diverse da quelle «vere»: allora i valori calcolati dagli integrali 
primi saranno diversi da quelli «veri»: però E, 7, ©, ty sono funzioni continue 
dei dati P, dP/dt, cioè variano di arbitrariamente poco purché P, 4P/dt varino 
in misura opportunamente piccola: più rigorosamente (si prenda per esempio 
5) per ogni numero reale e>o, esiste un numero reale è >o che dipende da e, 
tale che se le «osservazioni» differiscono dalle posizioni e velocità «vere» per 
meno di 3, allora il valore calcolato di 7 differisce da quello «vero» per meno 
di e (cfr. l'articolo « Infinitesimale ) in questa stessa Enciclopedia). 

A sua volta il valore predetto di P(#) a un dato istante #= ?, dipende in mo- 
do continuo dagli integrali primi E, 7, ©, ty (e dal parametro M). Allora la 
«funzione composta» che a partire dalle «condizioni iniziali » al tempo t= 0 for- 
nisce la predizione al tempo #=t, è pure continua, e quindi la predizione è vici- 
na quanto si vuole alla «realtà» purché le osservazioni siano abbastanza buone. 

Questo primo e più semplice tipo di stabilità, la «continuità rispetto alle con- 
dizioni iniziali», non è una proprietà caratteristica delle equazioni (1) del pro- 
blema dei due corpi, ma è una proprietà di ogni equazione differenziale ordina- 
ria dotata di un secondo membro che soddisfi opportune ipotesi di «regolarità», 
per esempio che sia «lipschitziano » (cfr. in questa stessa Enciclopedia l'articolo 
« Differenziale», IV, pp. 763 sgg.); questo però fu dimostrato in modo rigoroso 
solo nell'Ottocento. 

Ma le equazioni del problema dei due corpi possiedono un altro tipo di 
stabilità che è invece molto raro, tra le equazioni differenziali, anzi quasi uni- 
co: ci si limiti a considerare, tra le traiettorie descritte dalla (12), quelle con 
e=14+[(2E9?)/2]<1, cioè le orbite ellittiche. Poiché l’ellisse è una curva chiu- 
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sa, se P(#) percorre un'ellisse ripasserà successivamente dallo stesso punto dopo 
un certo tempo 7° (detto « periodo»), cioè P(T+t)= P(t). Se le condizioni ini- 
ziali variano di poco, P(#) percorrerà ancora un’ellisse vicina a quella prece- 
dente, e l’orbita sarà ancora periodica nel senso che P(T,+t)=P(?) con un 
periodo 7, diverso, sebbene di poco, da T. Ma la predizione che l’orbita sia 
periodica sarà soddisfatta lo stesso; per di più tale orbita, ripetendosi infinite 
volte, non si avvicinerà all'origine a meno di una distanza minima e neppure 
si allontanerà mai al di là di una distanza massima, che possono essere ricavate 
entrambe dalla (12). Perciò, per un tempo arbitrariamente lungo nel futuro o 
nel passato, il corpo P non potrà sfuggire all’infinito né collidere con l’altro 
corpo che lo attira, posto in O; e per di più la validità di tale previsione non è 
alterata da un errore — abbastanza piccolo — nella determinazione delle con- 
dizioni iniziali. 

Non solo: ma se l'errore nelle condizioni iniziali è abbastanza piccolo, l’or- 
bita prevista P(1) differirà da quella «vera» P(t), ma le due ellissi saranno vi- 
cine, con distanza massima che tende a o quando la differenza nelle condizioni 
iniziali tende a o. Quest’ultima proprietà va talvolta sotto il nome di «stabilità 
alla Lagrange» o «stabilità orbitale». Viceversa non è vero che se l’errore nelle 
condizioni iniziali, P(0)— P(0), e cosi (4P/4t)(0)— (4P/dt)(0), tende a zero, 
allora P(t)— P(t) tende a zero per ogni #. Infatti se le condizioni iniziali sono 
di poco errate, il periodo predetto 7; sarà diverso da quello vero 7; e perciò 
P(t) sarà si su di un’ellisse vicina a quella su cui si muove P(#), ma col pas- 
sare del tempo si troverà in una posizione sempre più distinta (in angolo ri- 
spetto all’origine) da quella in cui si trova P(t) allo stesso istante £: gli errori si 
accumulano col tempo lungo l'orbita, mentre vi è stabilità per gli errori perpen- 
dicolari all'orbita stessa. Si dice perciò che il problema dei due corpi non è 
«stabile secondo Ljapunov». 

Questo ha conseguenze molto importanti nelle applicazioni: se gli errori com- 
messi nel misurare il periodo di una soluzione del problema dei due corpi si 
accumulano nel tempo come errori di previsione della posizione futura, è vero 
viceversa che ripetendo la misurazione su più periodi consecutivi si accumula 
informazione sul valore esatto del periodo. 

Perciò le grandezze legate al periodo dei pianeti del sistema solare (come 
la durata di un anno, e la grandezza / ad essa collegata, cioè la massa del Sole 
moltiplicata per la costante di gravitazione universale, ovvero la costante di 
gravitazione universale in unità astronomiche in cui la massa del Sole è 1) 
sono le grandezze fisiche note con maggior precisione. (Per contrasto, si può 
notare che la costante di gravitazione universale in unità di misura terrestri è la 
costante fisica peggio nota, con neppure tre cifre significative certe). 

D'altro canto l’accumulazione degli errori lungo la traiettoria ha effetti 
molto negativi nel calcolo numerico; se si cerca di calcolare la traiettoria di un 
corpo celeste partendo dalle equazioni differenziali che generalizzano la (1) e 
integrandole numericamente con un veloce calcolatore elettronico della gene- 
razione oggi in uso, l'errore finale lungo la traiettoria sarà «probabilmente» 
proporzionale a 18/2 dove ? è l’intervallo di tempo a cui si vuole estendere la pre- 
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dizione (e solo a #!/? l’errore in direzione perpendicolare alla traiettoria) perciò 
nessun calcolatore, per quanto potente, può essere usato per calcolare numeri- 
camente un’orbita per più di qualche migliaio di periodi. Questo ha effetti im- 
portanti anche sulla ricerca teorica. 


3.  Perturbazioni ed equazioni di Hamilton. 


Ma il vero problema di stabilità del problema dei due corpi è un altro, e cioè 
quello della stabilità rispetto alle modifiche del modello fisico, alle «perturba- 
zioni» nella terminologia classica. Si supponga cioè che oltre all’attrazione del 
corpo posto in 0 agisca su P un’altra forza, piccola ma presente a ogni tempo f. 

Per esempio si può supporre che il corpo in O non sia sferico, per cui la 
sua attrazione gravitazionale non è sempre rivolta verso il centro geometrico O 
(problema del satellite); oppure si può supporre che i corpi in gioco siano 
tre, ciascuno dotato di massa e quindi capace di attirare ciascuno degli altri 
due (problema dei tre corpi). 

Per comodità di esposizione si usa anche prendere come esempio il caso in 
cui vi siano tre corpi, di cui due — P, e P, — dotati di massa finita w,, m, e uno 
P, considerato come « particella di prova» cioè attratto da P,, P, ma privo di in- 
fluenza su di essi; allora P; e P, si muoveranno su orbite soluzioni del proble- 
ma dei due corpi, come ad esempio due circonferenze con centro in O e raggi in- 
versamente proporzionali alle rispettive masse (problema ristretto dei tre corpi). 

Per intendere questo problema come « perturbazione » del problema dei due 
corpi in cui vi sono solo P, fisso in O di massa m=M e Ps, basta supporre 
che P, abbia massa #1, molto più piccola di 1; cioè si fa tendere a zero il «para- 
metro perturbativo» u=719/(1,+73). Ci si chiede allora se valga una qualche 
forma di stabilità rispetto al variare di u, cioè se per valori di p. abbastanza 
piccoli l'orbita di P3, pur non essendo più esattamente una conica, per esem- 
pio un’ellisse, conservi la proprietà di non avvicinarsi né a P, né a P, a meno 
di una distanza costante, e di non sfuggire all’infinito. 

Studiare questo problema di facile enunciazione richiede però un apparato 
matematico notevole, indicato tradizionalmente come «teoria delle perturba- 
zioni». L’idea base è quella di esprimere le equazioni di moto del problema 
dei due corpi, e quindi anche del problema « perturbato », in un sistema di coor- 
dinate tali che le soluzioni del problema «imperturbato» abbiano forma parti- 
colarmente semplice, espresse per esempio da funzioni costanti o lineari del 
tempo. Allora l’effetto delle perturbazioni sarà quello di far variare lentamente 
le grandezze che non sono più costanti e di variare di poco le velocità che non 
sono più costanti. Se tali variazioni sono abbastanza piccole, l'orbita di P; con- 
serverà un comportamento «stabile» (per esempio evitando le collisioni con P, 
e P,) per un periodo di tempo abbastanza lungo, e si presterà ad essere cal- 
colata mediante opportuni procedimenti di approssimazione. 

Quali siano Ie grandezze conservate dalle soluzioni del problema dei due 
corpi è chiaramente indicato dalle formule (3), (6) e (9): sono cioè il momento 
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angolare 7, l'energia totale E e l'angolo © che indica la direzione del pericentro: 
queste tre grandezze definiscono una conica di eccentricità, semiasse e orienta- 
zione dati. La quarta coordinata che occorre dovrebbe essere una funzione li- 
neare del tempo /=%(#—t), dove n» può anche dipendere dagli altri integrali 
primi. Si tratta di vedere se esiste un tale sistema di coordinate, atto a descri- 
vere tutte le soluzioni (o almeno quelle ellittiche) del problema dei due corpi, 
e in che modo è possibile scrivere le equazioni di moto del sistema perturbato 
in tale sistema di coordinate. 

La soluzione, anzi le soluzioni, via via più eleganti e raffinate, di questo 
problema, sono il risultato di quell’arco di circa cent'anni di studi che oggi è 
considerato l’epoca della meccanica celeste «classica», da Clairaut a Jacobi. 
Non si può certo ripercorrere tale strada, che può essere seguita sui trattati 
«classici» (Laplace, Jacobi, Tisserand, Brouwer e Clemence): ci si limita a 
citare la forma moderna della teoria delle trasformazioni delle equazioni della 
meccanica. Questa si applica alle equazioni differenziali che sono poste nella 
forma «di Hamilton» (cfr. in questa stessa Enciclopedia l’articolo « Differenziale», 
IV, $ 3.3), cioè che sono definite da una «funzione hamiltoniana» H(q, p) 
(q, p sono vettori: q= (9, ... In), P= (Py +: î)) mediante le formule: 


da; _ dH 
di dd |. 

(13) dp; _dH î=1,2,...,M. 
di dq; 


Le equazioni del problema dei due corpi si possono porre in tale forma pur di 
scegliere come coordinate g,, 9g, delle coordinate di P nel piano, per esempio 
le coordinate polari 7, 9, e come fj, py i momenti coniugati, in questo caso la 
velocità radiale dr/dt e il momento angolare 7=7?(d8/dt): allora la funzione 
di Hamilton del problema dei due corpi è 


(14) H(q, UP pop =1|s+ Bli 
dl 


ossia, come si verifica dalla (6), H(g,, 93; Py da)= E è l'integrale primo dell’e- 
nergia. (Si è «normalizzata» la massa del primario M a 1, supponendo di ef- 


fettuare un opportuno cambiamento di unità di misura). Le equazioni di Ha- 
milton sono allora: 


dl, dh 
dt di @ 

(15) : 
(did fl) fpap. 
dt dgq,\2gî q; dt 


Tutto questo è naturalmente solo un modo diverso di scrivere cose note, poi- 
ché le prime due delle (15) sono proprio le definizioni dei due momenti 
P,= dr/dt e p,=r*(49/dt), la quarta esprime il fatto che p,= 7 è un integrale pri- 
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mo, e la terza coincide con la (4). Però la formulazione (15) ha due vantaggi 
fondamentali. Il primo è che se si vuole aggiungere l’effetto perturbativo dello 
sdoppiamento della massa 1 posta in O nella coppia di masse 1—p e p poste in 
P, e P, che si muovono attorno ad O, basta calcolare l’energia potenziale gra- 
siazionale dei due corpi e sostituirla al termine —(1/9,)= —(1/r) che espri- 
meva l’energia potenziale gravitazionale di un solo corpo: ossia basta aggiun- 
gere alla hamiltoniana (14) una funzione perturbatrice R, 


(16) Ran tw by Po DE A 


dove 7,, r, sono le distanze di P, da P,, P, rispettivamente. 
Il secondo vantaggio consiste nella possibilità di effettuare trasformazioni 
di coordinate in modo relativamente semplice: basta assegnare una «funzione 
generatrice» S=.S(q,L) (L un vettore L= (L,, Lo, ..., Ln)); poi mediante le 
formule 
ds 


(9,1) 


dj ;_ 
(17) ds j=1,2;M 


L= 741) 


si definisce una trasformazione canonica dalle vecchie coordinate q e mo- 
menti p alle nuove coordinate 1 e momenti L (sotto opportune condizioni di 
regolarità e non-degenerazione, che non vale la pena di precisare qui [cfr. 
Goldstein 1950]). 

Il vantaggio di una trasformazione « canonica » consiste nel fatto che nel nuo- 
vo sistema di coordinate 1, L le equazioni di Hamilton (13) si scrivono an- 
cora come equazioni di Hamilton: 


dl, dK 
dt dL, 

(18) dl; _dK Jj=1}2 JM 
di dl 


dove la nuova hamiltoniana KX si ottiene semplicemente sostituendo le nuove 
variabili nella vecchia funzione di Hamilton H, cioè K(1,L)=M(g(L,L), 
p(1,L)) (teorema di Hamilton). Non solo: poiché la funzione S può essere 
scelta arbitrariamente, si può cercare una «funzione generatrice» .S tale da 
soddisfare a opportune condizioni; per esempio si può imporre a K di di- 
pendere solo dai nuovi momenti L e non dalle 1, il che impone alla S di soddi- 
sfare all’equazione (detta di Hamilton-Jacobi) 


(19) CICESIChO] =K(1) 


che è un’equazione alle derivate parziali. Se una funzione nota S=.S(q,L) è 
soluzione della (19), allora è nota la trasformazione definita dalle (17) che ri- 
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duce il sistema di equazioni (13) alla forma (18) con però K=XK(L), cioè 
dK/dl;=o0, e cioè alla forma 


dei n 
dd Pt 
YA) 


nella quale si legge che i nuovi momenti L; sono tutti integrali primi e le coor- 
dinate /; variano linearmente col tempo: 


L;= cost 
l;= @;(L)t+cost  j=1,2,...,m 


ost EL) 


j 
il che è esattamente quello che occorre per lo sviluppo di una teoria perturba- 
tiva. 

Purtroppo l'equazione (19) è assai difficile da integrare: poiché la (19) è 
un'equazione differenziale «alle derivate parziali» di S' e non «alle derivate or- 
dinarie» come la (13), è in effetti assai più difficile integrare la (19) che la (13), 
e il numero di problemi «hamiltoniani» per i quali si conosce una soluzione 
completa dell'equazione di Hamilton-Jacobi non supera la mezza dozzina. E 
tuttavia sono questi «sistemi integrabili» quelli che possono essere posti alla 
base di una teoria delle perturbazioni: il problema dei due corpi rientra ap- 
punto fra questi. Data infatti la funzione di Hamilton (14), l'equazione di Ha- 
milton-Jacobi corrispondente è 


r[(0òS]? r1TòSs]? ri 
Se. [| +2[x ea 


che può essere risolta per «separazione di variabili», cioè cercando una solu- 
zione S(91,92, L,, Ls) che sia somma di una funzione della q; e di una funzione 
di E S=S1(g,,L,,L,)+S, (> Ly; Lo), da cui la (20) si separa in due equa- 
zioni «ordinarie » per la semplice ragione che le due parti dipendenti solo da g, 
e solo da g, del primo membro della (20) devono essere entrambe costanti: 
òS,/dg,=py= cost. Per cui si può assumere che L,=f,, visto che p, è un 
integrale primo; e inoltre 


Gi) Mia]fara+ i È 
dg, a Ù 

A questo punto è ancora del tutto arbitraria la scelta della funzione K(L, La) 

per cui si può scegliere per semplicità K= K(L,); risulta allora per inte- 

grazione diretta: 


2 L3 1/2 
seg Î [ara +i- Di] da, 


1 
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e le nuove coordinate /,, /, si ottengono quindi applicando la regola (17): in par- 
ticolare 
òS —Lyd 
(2) hO ga( o 
òLs 2 Lì 
gi} 2K(L)+—-=7 
N I 


1 


Queste formule possono apparire complicate, ma in realtà la (21) coincide con 
la (7), che esprime la velocità radiale, poiché (dS/dg,) = p,= (dr/dt); e la (22) 
è esattamente la (9), per cui /, è proprio l’angolo © che esprime l’orienta- 
mento dell’ellisse. Allora, scelta s funzione K(L,), si definisce una trasforma- 
zione canonica in cui /,, L,, L, sono integrali primi, e = (#— to) è una funzione 
lineare del tempo con n=(dK/4L,)(L}). A questo punto per scrivere le equazio- 
ni del moto perturbato basta aggiungere alla hamiltoniana una funzione pertur- 
batrice, come per esempio la (16) per il problema ristretto dei tre corpi (ma il 
procedimento vale per qualunque perturbazione gravitazionale); allora, poiché 
la trasformazione canonica non cambia la funzione hamiltoniana (non ne cam- 
bia il valore nei punti corrispondenti per la trasformazione), la nuova hamilto- 
niana nelle variabili /,, 4, Ly, Lo sarà 


(23) K(L1)+R=H(9, dg Py Pa) +R, 


dove naturalmente R deve essere espressa in funzione di /,, l,, L,, L, e f. Le 
equazioni di Hamilton del moto perturbato nelle nuove variabili saranno al- 
lora: 


L 


dL,__dR dl, _dR 


(24) di _,,èR  dh_dR 


"au «a 


Le (24) vanno solitamente sotto il nome di sequazioni di Delaunay»; si noti 
che a parte il termine n= dK/dL,, tutta la parte restante dei secondi membri 
tende a o per p. tendente a 0; infatti per u=0, R è nulla come si vede dalla 
definizione (16) (se u=0, P, ha massa 1 e sta in O, mentre P, non esercita al- 
cuna influenza), d’altro canto R è una funzione continua di pu. A questo punto 
si supponga che p sia piccolo ma diverso da zero: per esempio nel sistema so- 
lare i due corpi più importanti sono il Sole e Giove, con la massa di Giove che 
è 1/1047 circa di quella del Sole, per cui si può descrivere abbastanza bene il 
moto di un piccolo pianeta come la Terra come un problema ristretto dei tre 
corpi con u=0,00095. Nel sistema di Delaunay (24) i secondi membri sono 
piccoli (salvo la «costante» x), dello stesso ordine di grandezza di yu: l’effetto 
accumulato in un tempo molto lungo di queste «piccole» perturbazioni può 
essere tale da cambiare le quantità L, (quindi K(L,)= E, l'energia) e L, (cioè 
3, il momento angolare) di quantità arbitrariamente grandi, oppure no? Non 
si può ottenere una conclusione del genere soltanto dalla « piccolezza» dei se- 
condi membri dell'equazione (24). Sapere infatti che la derivata di una gran- 


Stabilità/instabilità 432 


dezza è piccola con p, si supponga per esempio —u< (df/di)<u, non impedi- 
sce affatto che f(4)—f(0) abbia un valore dell’ordine di 1 purché # sia dell’or- 
dine di 1/u. Poiché l’età del sistema solare è pari a circa 4,6 miliardi di anni 
(nelle unità qui usate, £ arriva a circa 3 miliardi), questo non dice molto sulla 
stabilità del sistema solare. Ma c’è di peggio: è vero che la funzione perturba- 
trice R (16) è nulla per u= 0, ma non è vero che R sia più piccola in valore asso- 
luto di cp, con c una costante opportuna, e meno ancora questo è vero per le sue 
derivate. In termini fisici, l’effetto prodotto dalla piccola massa in P, è piccolo 
con la massa se si resta al di là di una distanza minima da P,, ma tende all’infi- 
nito per r, (distanza da P,) tendente a zero qualunque sia 4 maggiore di zero. 
Cosi Giove, pur essendo mille volte meno massiccio del Sole, esercita tuttavia 
un’influenza che è maggiore di quella esercitata dal Sole sui corpi abbastanza 
vicini, per esempio sui suoi quattordici e più satelliti, che infatti gli ruotano 
attorno. 

Naturalmente se il corpo P; percorre un’orbita che — per un tempo piccolo 
rispetto a 1/u — resterà vicina all’ellisse soluzione per u=0, le forze indotte dal- 
l'attrazione di P, non avranno sempre la stessa direzione, per cui il loro effetto 
non si accumulerà del tutto nel tempo. Si può allora tentare di calcolare un ef- 
fetto perturbativo «medio» di P,? È chiaro che mediare rispetto al tempo, 
cioè calcolare degli integrali del tipo 


i Î SL.) di 


tto lo 


e simili, comporta appunto di conoscere la soluzione L, (t) nell’intervallo tra ty 
e t,, per cui non è possibile un approccio diretto. 


4. Variabili azione-angolo e principio della media. 


Perché si comprendessero i fondamenti — e le lacune — dei metodi perturba- 
tivi del paragrafo precedente, fu necessario acquisire una visione geometrica 
globale della natura dei problemi integrabili (come quello dei due corpi) e del- 
l’effetto delle perturbazioni; il che avvenne solo nella seconda metà del secolo 
SCOrso. I 

Si ritorni alla hamiltoniana (14) dei due corpi che, come si è visto, defini- 
sce un sistema di Hamilton (15) dotato di due integrali primi: l’energia H=£ 
e il momento angolare p, =}. 

Si supponga allora di considerare non una particolare soluzione delle (15), 
ma la totalità delle soluzioni che hanno valori fissati di E, 7 - e quindi di L,, 
L, - nel sistema di coordinate definito dall’integrazione dell'equazione di Ha- 
milton-Jacobi. Queste soluzioni formano una superficie; non si tratta di una 
superficie nello spazio ordinario, poiché lo spazio delle fasi in cui si svolge il 
moto ha quattro dimensioni, cioè è parametrizzato da quattro numeri reali 
x,y, (dx/dt), (dy/dt) oppure r, 8, (dr/dt), (49/dt) oppure l,, b, Li, La; si trat- 


ta però di una varietà a due dimensioni (cfr. in questa stessa Enciclopedia l’ar- 
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ticolo « Geometria e topologia», VI, $ 5.1) descritta da due parametri, per esem- 
pio ki, bo. 

Per comprendere la geometria di una tale superficie, si può osservare che 
delle due coordinate che la descrivono, /, è un angolo, il che significa che se 4, 
viene incrementato di 277 (cioè di un angolo giro), ferme restando /,, Lj, Lo, 
il punto cosi rappresentato nello spazio delle fasi resta lo stesso. Ma anche /, è 
definito a meno di un periodo: infatti le soluzioni ellittiche (E<o) sono pe- 
riodiche rispetto al tempo, cioè quando # cresce a #+ 7, la soluzione ripassa 
dallo stesso punto e con la stessa velocità (cioè dallo stesso punto dello spazio 
delle fasi). Ma nell’intervallo di tempo 7, /, cresce di "7, e perciò anche un 
incremento di Tr di /, riporta allo stesso punto perché /,, L,, Ly siano costanti 
come lo sono su di un’ellisse fissa. Basta perciò che nT=2r perché /, possa 
pure essere considerato un angolo. Ora la funzione K(L,) è arbitraria, perciò 
si può scegliere in modo tale che n(L,)=(dK/4L,)(L;)=2n/T: basta porre 


(25) K(L)=-= 


I 

21 n(L,)= in) 

In effetti la (25) altro non è che la terza legge di Keplero: «I quadrati dei 
periodi sono inversamente proporzionali ai cubi dei semiassi maggiori», vi- 
sto che in questo modo risulta che L? è il semiasse maggiore dell’ellisse. Con 
questa scelta, /, e /, sono angoli (definiti a meno di multipli di 27) e perciò la 
varietà di livello H= E, p,=} è un toro, prodotto di due circonferenze (cfr. 
fig. 1). 

Questo risultato geometrico è stato ottenuto sfruttando le particolari pro- 
prietà delle soluzioni ellittiche del problema dei due corpi; ma in effetti esso ha 
carattere assai più generale, come hanno dimostrato Arnol’d e Jost. Qualunque 
sistema hamiltoniano con una hamiltoniana H(g,, 93, f,, 23) 2 «due gradi di li- 
bertà» (cioè g, p in R?), dotato di due integrali primi H ed F «funzionalmente 
indipendenti» (cioè che non sono esprimibili l’uno come funzione dell’altro), 
ammette «varietà di livello» di dimensione 2 regolari. Ebbene, se tali varietà di 
livello sono compatte (cfr. per la definizione l’articolo « Geometria e topologia » 
in questa stessa Enciclopedia: in pratica occorre che soluzioni aventi quei dati 
valori fissi H ed F' non possano né andare all’infinito né avvicinarsi indefinita- 
mente a «singolarità » della funzione hamiltoniana come la collisione r=0 nel 
problema dei due corpi), allora esse sono necessariamente dei tori, e per di più 
esiste un sistema di variabili dette azione-angolo a cui ci si può ricondurre con 
una trasformazione canonica, tali che le variabili azione L,, L, definiscono il 


Figura 1. 


La varietà di livello è un toro, prodotto di due circonferenze. 
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toro su cui ci si muove, e le variabili angolo .,, ), parametrizzano il toro, con 
equazioni di moto nel nuovo sistema di coordinate della forma 


dl dl. 
= ©01(L,, Lo) L= %Wg(Ly, La) 
(26) di dt 
dl, dla, 
dt dt 


È facile verificare che le (26) equivalgono a supporre che la nuova hamiltoniana 
nelle variabili 1, L deve essere della forma K=XK(L,, La), indipendente da Î, 
ed /,. È anche chiaro che il teorema di Arnol’d-Jost assicura proprio la torta 
del sistema hamiltoniano richiesta per l’applicazione di una teoria perturba- 
tiva. Anche se, per semplicità, ci si è limitati al caso m=2 di due coordinate, 
due momenti e due integrali primi, va citato che il teorema di Arnol’d-Jost va- 
le pure per qualsiasi sistema hamiltoniano con hamiltoniana 7(q, p) con q, p 
vettori a m componenti, purché vi siano m integrali primi H, F, ..., {n funzio- 
nalmente indipendenti, con la condizione aggiuntiva che questi “ commutino 
tra loro», cioè che se si prende uno qualsiasi di essi come hamiltoniana, il si- 
sistema hamiltoniano che ne risulta abbia gli stessi integrali primi H, F.,..., 
F,» In questo caso le variabili azione L; sono m, quelle angolo /; pure m, e le 
«varietà di livello» se compatte sono tori m-dimensionali, cioè il prodotto di m 
circonferenze [cfr. Arnold e Avez 1967]. 

Allora per ogni sistema hamiltoniano «integrabile nel senso di Arnol'd e 
Jost», cioè con abbastanza integrali primi che commutano tra loro, si può de- 
finire una teoria delle perturbazioni trattando le hamiltoniane perturbate come 
una serie di potenze in un parametro perturbativo: 


(27) H(4L,p)=Hs(L)+uR;(1,L)+y2R:(LL)+.. 


dove H, è la hamiltoniana del sistema integrabile, ridotta alla forma dipen- 
dente solo dalle L (come nel sistema hamiltoniano (26)). Allora le equazioni di 
Delaunay definite dall’hamiltoniana (277) sono della forma 


dn EN 
deg Rai 
(28) 
dl; r òR, da 
de STE Htesgteazt 


Per dare un senso al dle delle (27) e (28), che altrimenti è puramente 
formale, occorre supporre che p sia piccolo; per esempio, come nel caso del 
problema ristretto Sole-Giove-T'erra, u sia circa 1/1000; allora i termini che 
hanno a fattore u? sono «più piccoli» di 1 milione di volte di quelli principali, 
e cosi via, e perciò sono «trascurabili» in una prima approssimazione alle solu- 
zioni del problema. 

In questo contesto si può enunciare il principio della media (nella termi- 
nologia moderna) o dei termini secolari (nella terminologia «classica» di La- 
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grange): si consideri il sistema mediato dato da variabili 7=(%, -...7m) che 
soddisfino a equazioni 


d I òR 
(29) dh Cia a/ Da dl, 
Tm 


dl 


e simili per f,, ..., 7,» dove il secondo membro è ottenuto «mediando» su di 
un toro 7, (del teorema di Arnol’d-Jost) il termine del primo ordine in u 
della « perturbazione ». Ora, se le /; sono variabili angolo definite a meno di mul- 
tipli di 277, R, deve essere una funzione periodica di periodo 27 in ciascuna 
delle variabili /;, perciò 


7 dR 
J aper =R(2x, Ia, ccm Ly Lm) —R(0, h,... omo Las Lm)=0 
e quindi il secondo membro della (29) è in realtà nullo, e le 7; sono costanti. 
Adesso si confrontino le soluzioni del sistema perturbato (28) e quelle del si- 
stema mediato (29), confrontando le variabili azione I; soluzione del primo con 
le variabili azione mediate #; soluzione del secondo, nell’ipotesi che le condi- 
zioni iniziali siano le stesse, 7;(0)=;(0). Allora il principio della media so- 
stiene più o meno che le 7; sono una "buona approssimazione delle 7; mediate 
su di un tempo abbastanza lungo, cioè la media su di un toro approssima bene 
la media temporale [cfr. Arnol’d 19/74]: in altri termini l'andamento delle va- 
riabili azione /; nel tempo è approssimabile bene (al primo ordine in p) con un 
andamento secolare espresso dalle 7; più termini periodici. Volendo formalizzare 
si potrebbe dire che per un tempo molto lungo (dell’ordine di 1/u) vale la mag- 
giorazione —cu?<%;(t#)—1;(t)<cu? per c una costante opportuna. 

Tale « principio » non può essere accettato senza dimostrazione, anche perché 
è chiaro che il ragionamento su cui sembra basarsi è circolare: se le variabili 
azione non cambiano troppo al trascorrere del tempo, mentre le variabili an- 
golo girano rapidamente, allora mediare sui tori è molto simile a mediare ri- 
spetto al tempo, e perciò a meno di termini periodici le variabili azione /; sono 
costanti come le 7;, e quindi le I; variano di poco. In effetti tale «principio» 
non è affatto un teorema, anzi si conoscono dei controesempi, anche se «in 
molti casi » il principio funziona. Per rendersi conto del perché un simile « prin- 
cipio » fosse accettato come metodo per decidere sulla stabilità dei problemi di 
meccanica (specialmente celeste) occorre fare uso della tecnica degli sviluppi 
in serie trigonometriche (o di Fourier, come oggi si chiamano; ma Lagrange 
ha lavorato molti decenni prima di Fourier con questi metodi. Per le serie di 
Fourier si veda in questa stessa Enciclopedia l'articolo « Calcolo», II, pp. 443-45). 

Poiché la «funzione perturbatrice» R, è una funzione periodica degli angoli 
l;, si può supporre che essa si decomponga come somma di armoniche pure, 
cioè di funzioni del tipo (si considera per semplicità di notazione il caso m=2 
di due soli angoli /,, 43) 


(30) Byx:(L) exp(i(42,+k/,)) 
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con h,k numeri interi, e dove e'°=cos9+?sin9 è la formula di Eulero, 
usata qui semplicemente come notazione sintetica per le funzioni trigonome- 
triche seno e coseno (cfr. in questa stessa Enciclopedia l’articolo « Funzioni», 
VI, $ 7). Purché R sia una funzione periodica abbastanza regolare, essa sarà 
sempre esprimibile non come somma finita, ma come serie, definita dal passag- 
gio al limite su di una somma infinita di termini come (30): 


3) Ri(lyloLyla)=Y Bui(LyLa) expli(M+H;) 


dove la somma è estesa a tutte le coppie di interi relativi £ e &. Allora una delle 

equazioni (28) si può scrivere derivando termine a termine (come si farebbe, 

per la linearità dell’operazione di derivazione, per una somma finita) la serie 

(31); e dalla regola elementare di derivazione de'*/dt = ie si trova per esempio 

per Li: 

(32) br rad Bpx (Ly, Lo)ih exp (i(41,+kl))+0(w) 
(h,k)#(0,0) 


x 


dove la somma è estesa alle coppie (4,f) diverse dalla coppia (0,0) e o(w) 
include tutti i termini che contengono potenze di u maggiori di 1 (e perciò 
«piccoli »). 

Ora, se si sostituiscono nel secondo membro della (31) al posto di /,, la, 
L,, L, le soluzioni costanti o lineari del problema non perturbato (26), si «tra- 
scura» un altro termine del tipo o(u), come si può vedere usando il teorema 
della derivata della funzione composta. Ma allora il secondo membro risulta 
somma di termini del tipo hiB,, (costanti) per termini trigonometrici puri del 
tipo exp(i(4/,+4/)t). Perciò la serie a secondo membro della (32) è una se- 
rie di funzioni trigonometriche del tempo (a meno di o(p.)) e quindi L, si può 
ottenere integrando termine a termine (a meno di o(u)) con la formula in- 
versa della precedente, cioè (e? dt= (1/i)e"+ cost; 


L(t)=L:(0)-  Y Ba(L(0),L2(0)) 
(33) (A,k)#(0,0) 
exp(i (hw +k03)t)+0(u). 


h 
how,t+h0g 


Nella (33) sta scritto appunto il principio della media, perché L, è espressa 
come un termine mediato — costante, come si è visto -- più termini periodici, 
più termini dell’ordine di u?. Non ci sono termini secolari, cioè della forma 
at+bt*+... che risulterebbero dall’integrazione di termini non trigonometrici 
a+2bt+...; infatti il termine con 4=A=0, che conterrebbe una funzione del 
tempo eÎ=1 (costante), è assente; perciò per ogni arco di tempo L, è limi- 
tato (a meno di o(u)). 

Questo risultato, chiamato da Lagrange nel 1776 teorema di stabilità del 
sistema solare, sembrò a suo tempo la soluzione finale al problema della stabi- 
lità nei problemi del tipo «n corpi». Non solo, ma le soluzioni del tipo (33), 
oltre ad essere stabili nel senso di non tendere all’infinito, sono anche adatte 
alla predizione di orbite di corpi celesti reali, e perciò «stabili» nel senso più 
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generale discusso nel paragrafo 1. Infatti espressioni come la (33) sono com- 
poste di termini che sono esplicitamente calcolabili, pur di svolgere esplicita- 
mente il procedimento di analisi armonica della funzione perturbatrice R,, 
cioè pur di calcolare esplicitamente, magari a loro volta mediante sviluppi in 
serie, i coefficienti B,,(L,, Ly). Perciò le soluzioni perturbate (a meno di o(L)) 
sono esplicitamente calcolabili con approssimazione arbitrariamente piccola, 
pur di avere la pazienza di calcolare abbastanza termini fino a trascurarne solo 
di molto piccoli [per un’esposizione moderna di questo metodo, cfr. Brouwer 
e Clemence 1961]. 

Vale la pena di osservare che tale procedimento è esattamente lo stesso (sal- 
vo la notazione, «analitica» anziché «geometrica») che veniva chiamato degli 
epicicli nell’astronomia anteriore a Keplero e Newton (cfr. del resto in questa 
stessa Enciclopedia gli articoli «Modello», IX, pp. 405 sgg. e «Astronomia»), 
visto che ogni termine (30) rappresenta una circonferenza percorsa con velocità 
uniforme, e l’orbita viene rappresentata mediante un numero finito di tali ter- 
mini. Naturalmente i matematici del x1x secolo erano ben consci che troncare 
una serie a un numero finito di termini rappresenta un’approssimazione, men- 
tre ciò non era probabilmente chiaro ad astronomi più antichi; va notato però 
che anche gli astronomi degli epicicli si riservavano di usare qualsiasi numero 
di epicicli, e in pratica usavano un numero di termini non indifferente (parecchie 
decine). 

Nello sviluppo della ricerca astronomica e meccanica, nell’epoca d’oro della 
meccanica celeste classica, questo procedimento di approssimazione per serie 
trigonometriche delle soluzioni fu usato con tenacia e ingegnosità sconosciuti 
ai frettolosi ricercatori d’oggi; senza peraltro fare uso di principî fondamental- 
mente diversi da quelli qui esposti. Per dare un’idea della mole del lavoro, è 
probabile che il record sia tuttora detenuto da Clemence, la cui teoria dell’or- 
bita di Marte contiene oltre mille termini trigonometrici. La concordanza con 
le osservazioni astronomiche, per tutti i pianeti del sistema solare, delle predi- 
zioni basate su questi calcoli, fu talmente buona che soltanto piccolissimi «re- 
sidui», cioè differenze, di pochi secondi d’arco (un secondo d’arco, per inten- 
dersi, è l’angolo sotteso dal diametro di una moneta da so lire a 5 chilometri di 
distanza) restavano da spiegare alla fine del x1x secolo, e soltanto pochi fra 
questi, tra cui il più grosso era un residuo di 8 secondi d’arco per Mercurio, 
superavano il valore medio degli errori osservativi [cfr. Tisserand 1889-96]. 
Fu proprio l’aver spiegato questo termine la prima conferma della relatività 
generale. Val la pena di osservare, a questo proposito, che ancora oggi le effe- 
meridi dei pianeti producono, rispetto alle osservazioni, «residui» sistematici di 
circa 1 secondo d’arco (il cosiddetto «effetto di opposizione »), malgrado il pro- 
gresso delle tecniche osservative e spaziali e dei metodi di calcolo basati sull’uso 
di grandi calcolatori. . 

Se vale la pena di soffermarsi su questa storia della meccanica celeste clas- 
sica non è solo perché questi metodi sono ancora attuali, visto che sono stati 
solo in parte sostituiti, e in tempi recenti, da una nuova generazione di metodi 
numerici basata sulla disponibilità di mezzi di calcolo automatico milioni di 


15 
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volte pit veloci (cfr. del resto in questa stessa Enciclopedia la parte conclusiva 
dell’articolo « Calcolo »). 

Ciò che più interessa è che questa parte della storia della matematica e della 
fisica rappresenta un caso particolarmente paradossale dal punto di vista del 
problema della stabilità. Infatti il procedimento perturbativo basato sugli svi- 
luppi in serie trigonometriche che è stato sommariamente descritto, è matema- 
ticamente del tutto illegittimo, e la sua conclusione è logicamente falsa. 

Se ne può vedere il perché tornando per un momento con occhio più critico 
sulle formule (32) e (33): è vero che derivazione e integrazione sono operazioni 
lineari, cioè possono essere eseguite termine a termine se applicate alla somma 
di due o più funzioni; ma non è affatto vero che la stessa cosa vale per un nu- 
mero infinito di termini, cioè per una serie. Cosi se si suppone che la formula 
(31) abbia senso, cioè che la serie che esprime R, converga (il che è sempre 
assicurato purché la funzione perturbatrice R, sia abbastanza regolare), ciò 
non significa affatto che la serie a secondo membro della (33) converga, vista la 
presenza del fattore 4/(4©w,+k%,) che può diventare arbitrariamente grande: 
ora un teorema di calcolo differenziale (che naturalmente non era noto ai tem- 
pi di Lagrange) dice che la derivazione e l’integrazione di una serie termine a 
termine sono possibili a condizione appunto che tutte le serie in questione con- 
vergano (uniformemente). Perciò, se la serie a secondo membro della (33) di- 
verge o ha comportamento irregolare, il secondo membro non ha senso e il 
primo membro L,(#) non ha niente a che fare con lo sviluppo in serie che la 
(33) sembra assegnargli; in particolare può darsi benissimo che la vera soluzione 
L,(t) contenga dei termini secolari at+dt*+... ed eventualmente non sia nep- 
pure limitata. 

Per vedere quale sia veramente l’ostacolo, si esamini il « denominatore» 
htw,(L)+Z%g(L): i termini che rischiano di far divergere la serie sono quelli 
in cui il «denominatore » è piccolo. 

Ora il «denominatore» può essere addirittura zero per alcuni valori di % 
e k, se il rapporto tra «0;(L) e ©0,(L) è razionale; e precisamente per quegli 4, £ 
tali che ©%y(L)/w,(L)= —(k/4) e in tal caso il procedimento dello sviluppo in 
serie di Fourier non è legittimo, perché il termine exp(i(@0,l1+@,f)f) è co- 
stantemente uguale a 1 e il suo integrale è appunto #, cioè un «termine secolare». 
Per prima cosa cioè per assicurare un senso allo sviluppo (33) occorre che 
&è/%g sia irrazionale per il caso considerato, per esempio per un certo pianeta. 

Si nota subito che affermare che una grandezza di un modello matematico 
della realtà fisica, che dovrebbe svolgere il ruolo di osservabile (come si è visto 
nel paragrafo 2 i periodi, e quindi le frequenze, sono facili da osservare), deve 
essere irrazionale per l'applicabilità del modello stesso è, dal punto di vista della 
stabilità, un vero suicidio scientifico. Infatti i numeri razionali e quelli irrazio- 
nali sono due sottoinsiemi dei numeri reali densi l’uno nell’altro, il che significa 
esattamente che per quanto piccolo sia l’errore di misura nelle osservabili ©, 
e 605, è impossibile decidere sulla base di tale misura se &%,/0y è razionale o ir- 
razionale. Inoltre non è affatto vero che purché &©/%, sia irrazionale la (33) 
è dotata di senso: se &%;/w, non è mai pari al quoziente di due interi, è però 
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possibile scegliere gli interi 4, £ in modo che la frazione —4/k approssimi 
1/0, molto bene (per esempio con il procedimento detto dello sviluppo in 
frazioni continue), e quindi il «denominatore» X6wj+@, sia molto piccolo. 
Se tali «piccoli denominatori » sono presenti, la serie (33) sarà pure divergente; 
e quel che è peggio, anche tale presenza di « piccoli denominatori» dipende da 
proprietà del numero irrazionale ©,/wy che non sono discriminabili da alcuna 
misura con precisione finita [cfr. Wintner 1941]. La conclusione di questo ra- 
gionamento sembra una vera disfatta della ragione e della scienza moderna, 
tanto più grave quanto più grande era stato il successo pratico della meccanica 
celeste nelle predizioni astronomiche e quanto più importante era stata proprio 
questa teoria nell’affermarsi di filosofie meccaniciste o positiviste: poiché un 
metodo illogico fornisce predizioni praticamente utili, mentre un esame rigo- 
roso del problema degli x corpi non fornisce alcuna indicazione pratica. Non 
solo: ma il problema del rapporto razionale delle frequenze sembra risiedere 
nel problema imperturbato, a u=0, cioè nella hamiltoniana K,(Z), e non nella 
perturbazione: per esempio nel problema dei due corpi; o per lo meno è la 
soluzione di «ordine o in u», cioè del problema imperturbato, da cui si parte, 
che determina quali sono gli indici critici 4, & e quindi i termini critici B,, 
della funzione perturbatrice R, che producono effetti secolari o almeno ampli- 
ficati. Fortunatamente fenomeni di questo genere sono ben noti in matematica 
e in fisica, sotto il nome di risonanze. Poiché questo termine è usato talvolta 
in modo un po’ miracolistico per «aggiustare» i casi in cui le teorie ordinarie 
falliscono (cioè sono instabili logicamente, diventano inconsistenti per effetto 
di una piccola perturbazione), occorre soffermarsi con qualche attenzione su 
questo termine. 


5. Risonanze e orbite periodiche. 


Per comprendere il senso della parola ‘risonanza’ si ritorni al caso di un si- 
stema integrabile nel senso del teorema di Arnol'd-Jost; per esempio nel caso 
di due «gradi di libertà», un sistema in quattro variabili /,, 4, L,, L, in cui L 
e L, siano integrali primi, cioè la hamiltoniana sia funzione solo di L,, Ly: 
H=_H;(L,, Ls). Allora le variabili angolo variano linearmente col tempo su di 
un toro fisso: 


dl, òdH, dl, òdH, 
sE FARFA ) TATA, 
wo |dli_ dL, _ 

di gr 
cioè: 

(35) L= ©1(L)t+Lo 


L= ©g(L)t+/% 
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Ora si suppone che su di un toro fissato le due frequenze +, ed &, siano 

«risonanti» cioè in rapporto razionale tra loro 

6) @(L) A 
G o,(L) È 
(4, k interi); si aspetta un tempo 7 tale che /, sia aumentata di % giri, cioè 
wiT'=h-27; nello stesso tempo 7, per la (35) 4, è aumentato di w,T=A-2r 
cioè di & giri. Ma poiché /,,/, sono variabili angolo, il punto sul toro descritto 
dai nuovi valori di Z,, /, è lo stesso descritto dai valori a #=0 cioè /,o, ag. Poi- 
ché questo ragionamento non dipende affatto dai valori iniziali /,o/x9, ne 
risulta che dopo un periodo 7 tutte le orbite sul toro ripassano dallo stesso 
punto da cui erano partite. Perciò tutte le orbite situate sul particolare toro 
soddisfacente la (36) sono periodiche con lo stesso periodo 7, cioè ripassano 
dallo stesso punto a intervalli regolari, lunghi 7. Si supponga ora di « pertur- 
bare» il problema integrabile, cioè di introdurre un parametro p: 


(37) H=H+pR,+u2R,+... 


Cosa accadrà per u#0, ma piccolo, delle orbite periodiche? Per rispondere a 
questa domanda occorre porsi per prima cosa un problema a monte: come si 
trovano le orbite periodiche? La parola ‘trovare’ ha in realtà un significato vago 
e ambiguo: in effetti si possono cercare dei teoremi che dimostrano l’esistenza, 
sotto certe condizioni, di orbite periodiche e le loro proprietà; si possono cer- 
care le orbite periodiche conducendo «esperimenti numerici» con un calcola- 
tore; si possono cercare nel cielo fenomeni periodici, o apparentemente tali, 
che facciano pensare alle risonanze. Nella ricerca in meccanica celeste tutti e 
tre questi procedimenti hanno un loro valore, e i loro risultati s'intrecciano in 
un modo inconsueto, se si considera quanto sono diversi gli strumenti (la pura 
logica, il calcolatore e il telescopio — o la sonda spaziale) che si utilzzano. 

Si supponga allora di cercare le orbite periodiche di un sistema perturbato. 
L'idea fondamentale in questo campo risale a Poincaré [1892-99], ed è quella 
della «superficie di sezione »: si prenda un sistema come il (34); se nello spazio 
delle fasi (in questo caso a quattro dimensioni) si fissa il valore di una coor- 
dinata angolo, per esempio /,=0, si definisce nello spazio delle fasi una ipersu- 
perficie S (a tre dimensioni). Presa un'orbita che parte da un punto O di S 
per #=0, dopo un certo tempo 7 la stessa orbita potrà ritornare a passare da 
un punto Q, di S; se la velocità iniziale nel punto Q non è tangente alla S e la 
velocità finale in O, ha la stessa proprietà, allora l’applicazione © che associa 
a ogni punto Q di $S il punto di «ritorno su S», Q,, corrispondente, è regolare 
(quanto lo è l’equazione differenziale) e perciò si può calcolarne le derivate e 
applicare i teoremi della funzione implicita e simili (cfr. fig. 2; che però rap- 
presenta il caso a tre dimensioni, in cui S è una superficie). 

Nel caso che S sia definita dal valore costante di una variabile angolo, co- 
me nell'esempio considerato ],j=0, è chiaro che s’intenderà per ritorno su S 
anche il caso in cui /, diventa uguale a 2x7 (oppure —2r), perché a ,j=0 e 
1,== 27 corrispondono gli stessi punti. 
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Tale applicazione 0, se e dove è ben definita e regolare, prende il nome 
di applicazione di Poincaré ©(0)=0;. Se ora P è un punto di .S che sta su 
di un’orbita periodica, dovrà avere la proprietà che © (P)= P, oppure 0 (0 (P))= 
=0?(2)= P, oppure 0*(P)= P, ecc. perché prima o poi l'orbita deve ripassare 
da P e perciò attraversare S in P. Viceversa, se P è un punto periodico per 0, 
cioè 0*(P)= P per qualche & intero #0, allora per P passa un’orbita periodica, 
di periodo magari molto lungo se & è grande: infatti per ogni punto dello spazio 
delle fasi passa una e una sola soluzione delle equazioni, e perciò se la soluzione 
P(t) ripassa da P(0) dopo il tempo 7, P(0)=P(T), varrà pure per ogni #: 
P(t)=P(t+T). 

Perciò il problema di trovare un’orbita periodica è ridotto a quello di tro- 
vare un punto unito per l’applicazione di Poincaré, oppure di una sua iterata, 
cioè a risolvere l’equazione 


(38) ®(P)-P=0 


o l’analoga con 0 al posto di 0. 

L’equazione (38) è un’equazione non-lineare vettoriale (sia l’incognita P 
sia il secondo membro stanno su S, varietà a tre dimensioni) e perciò è difficile 
che se ne possano calcolare esplicitamente le soluzioni, anche ammesso di cono- 
scere esplicitamente l'applicazione di Poincaré. Si cerca allora di approssimare 
la soluzione mediante un procedimento di approssimazioni successive: per esem- 
pio se si prende come primo tentativo il punto P,, risulterà 0(2,)#2;; allora 
come secondo tentativo si potrà provare con il punto 


69) Pi=r-|pee-?) 


[60-20 


P=P, 


Figura 2. 
II metodo della sezione. 
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La formula (39) può sembrare complicata, e lo è perché lo spazio su cui si ope- 
ta è una varietà a tre dimensioni; però si supponga per un attimo che la su- 
perficie di sezione abbia dimensione 1, cioè sia una curva: allora la (39) dice 
che l'incremento da dare a P, per l’iterazione successiva è l'opposto del quo- 
ziente tra il valore della funzione ©(P)—P, calcolata in P,, e il valore della 
sua derivata, calcolata pure in P;; cioè la (39) altro non è che la formula di 
Newton-Raphson (si veda in questa stessa Enciclopedia l'articolo «Calcolo», 
II, pp. 465-66), che in effetti converge (con esponente di convergenza 2, cioè 
molto velocemente) anche nel caso multidimensionale purché il punto P, sia 
abbastanza vicino a un punto periodico P, purché © sia una funzione abbia 
stanza regolare e soddisfi a condizioni di non-degenerazione che qui si omet- 
tono, e purché la (39) abbia senso per ogni iterazione. Nel caso unidimen- 
sionale la condizione perché la (39) abbia senso è che la derivata al denomina- 
tore sia effettivamente invertibile, quindi diversa da zero; nel caso multidimen- 
sionale la derivata d4(0(P)— P)/dP è una matrice, e perciò la condizione di in- 
vertibilità è che essa abbia determinante diverso da o se calcolata in P (e per- 
ciò anche nei a vicini, per continuità): 


40) det-L(©(P)-P)lp.p=det(A(P)-1)x0, 


dove A è la «matrice jacobiana» delle derivate parziali di © e / è la matrice 
identità (1 sulla diagonale, o altrove). Si noti che la (40) è in effetti una con- 
dizione sull’orbita periodica che si sta cercando, poiché A deve essere calcolato 
in P, punto unito cercato: un’orbita periodica che soddisfi alla (40) si dice dif- 
ferenziabilmente isolata. Perciò, in linea di principio e sotto condizioni spesso 
verificate, ogni orbita periodica « differenziabilmente isolata» può essere «tro- 
vata» come limite di un procedimento iterativo di Newton-Raphson, cioè in 
pratica approssimata arbitrariamente bene con un numero adeguato di itera- 
zioni del procedimento (39). i 

Si noti che la formula di Newton-Raphson (39) non richiede affatto di co- 
noscere 0(P) per ogni P, ma solo per i punti successivamente incontrati nel- 
l’iterazione, P,, P,, P., ...; assieme però alla matrice jacobiana calcolata negli 
stessi punti: 4(P;), 4(P;), A(P.), ... Questo è molto importante nel caso di 
un sistema perturbato (cioè con la hamiltoniana (37), con u40): infatti in 
tal caso non è affatto detto che sia possibile conoscere ©(P) in funzione di P 
con una formula esplicita; però sarà sempre possibile calcolare un valore appros- 
simato di ©(P,) per un singolo punto P,, per esempio usando un procedimento 
di calcolo numerico d’integrazione delle equazioni differenziali di Hamilton 
con punto iniziale P., e poi interpolando il valore © (P,) al passaggio attraverso S. 

Non solo: ma integrando delle altre opportune equazioni differenziali, 
dette «equazioni alle variazioni», si possono calcolare numericamente anche i 
valori delle derivate parziali delle soluzioni delle equazioni differenziali di Ha- 
milton rispetto alle condizioni iniziali, e perciò anche le derivate contenute in 
A(P.). Perciò il procedimento (39) è realizzabile in pratica, in modo approssi- 
mativo, per qualsiasi sistema di equazioni differenziali, per quanto complicata sia 


443 Stabilità/instabilità 


la perturbazione, pur di usare un algoritmo di soluzione delle equazioni stesse, 
facilmente implementabile su di un calcolatore (anche piccolo). Questo spiega 
a sufficienza perché sulle orbite periodiche è possibile effettuare esperimenti nu- 
merici col calcolatore; non spiega però a cosa serve, se cioè questi esperimenti 
dimostrano qualche cosa. Infatti, per quanto ingegnose siano le tecniche di 
calcolo numerico usate per ottenere soluzioni che approssimano da vicino la 
soluzione esatta, non è mai possibile dimostrare con calcoli numerici che due 
numeri reali sono uguali, se non altro perché ogni calcolatore tratta numeri con 
un numero finito di decimali (commettendo cosi un errore di arrotondamento) 
e perché i procedimenti di discretizzazione impiegati per tradurre le equazioni 
differenziali in equazioni alle differenze finite producono a loro volta errori « di 
troncamento» (cfr. in questa stessa Enciclopedia l’articolo «Calcolo», II, $ 4). 

Poiché gli errori numerici si accumulano con il procedere dell’integrazione 
numerica, per quanto precisa sia l’approssimazione della soluzione trovata per 
un intervallo finito di tempo, l’errore che si commette su di un intervallo illimi- 
tato di tempo è sempre illimitato (almeno per sistemi hamiltoniani). Perciò, 
anche ammettendo che si trovi quella che, con tutta la precisione possibile pra- 
ticamente in un esperimento numerico, appare un’orbita periodica (cioè 0 (P) 
Sa con P fino a una certa cifra decimale), ciò non dimostra affatto che 
©*(P)—P non cresca con k, magari diventando arbitrariamente grande. 

La situazione però cambia radicalmente se si può dimostrare per una via 
del tutto indipendente dall’esperimento numerico che vicino all’«orbita perio- 
dica numerica» P si trova un’orbita periodica vera P. In tal caso la conoscenza 
dell’approssimazione dell'orbita di P calcolata con un procedimento numerico 
fornisce informazioni non solo su di un tratto finito dell'orbita stessa, ma su 
tutta l’orbita per # qualunque: perché se l’orbita è periodica di periodo 7, basta 
conoscerne (magari con una certa approssimazione) il tratto per # compreso 
tra o e 7 per conoscere (con la stessa approssimazione) tutta l’orbita per ogni #, 
che non fa altro che ripetere infinite volte lo stesso percorso. 

Ora il fatto essenziale è che la condizione (40), che definisce un’orbita pe- 
riodica differenziabilmente isolata, garantisce anche che se un’orbita periodica 
esiste per un dato sistema (per esempio quello integrabile, con parametro per- 
turbativo u=0) allora esiste per sistemi «vicini» (nel caso considerato, defi- 
nito dalla hamiltoniana perturbata (37), per w abbastanza piccolo) [cfr. Siegel 
e Moser 1971]. Questo deriva semplicemente dall’applicazione del teorema della 
funzione implicita all’equazione (38): naturalmente occorre la versione multi- 
dimensionale del teorema della funzione implicita. 

Perciò nel caso di orbite periodiche differenziabilmente isolate del proble- 
ma imperturbato (u= °) la persistenza di orbite periodiche anche nel problema 
perturbato (u70) non è in dubbio. Nel caso del problema integrabile (34) le 
orbite periodiche però non sono isolate, ma addirittura formano interi tori, 
come si è visto; tuttavia è possibile ridursi a considerare come isolate le orbite 
periodiche che soddisfano a particolari condizioni di simmetria. Per esempio, 
nel caso del problema dei tre corpi, si possono considerare solo le orbite che 
soddisfano a questa condizione: quando i tre corpi P,, P., Py sono allineati, le 
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velocità di tutti e tre sono perpendicolari alla linea dei tre corpi. Allora le orbite 
periodiche soddisfacenti a questa condizione sono differenziabilmente isolate 
per u=0, e quindi esistono anche per u#0 [cfr. Szebehely 1967]. 

Di conseguenza per p#0 i tori costituiti da orbite periodiche del problema 
imperturbato si sfasciano, lasciando posto a un numero finito di orbite periodi- 
che isolate. 

Ora un piccolo intorno di queste orbite periodiche isolate può essere studia- 
to con il classico procedimento della linearizzazione: in pratica se 04(P)=P, 
per un punto vicino a P, P, si ha ©*(P)=P+ A*(P)(P-P)+o0(P- P), dove 
A(P) è la matrice jacobiana delle derivate parziali dell’applicazione di Poin- 
caré, che rappresenta la linearizzazione dell’applicazione stessa in P, cioè il 
suo differenziale, e il simbolo o rappresenta come al solito i termini del secondo 
ordine nella differenza P— P. Poiché è relativamente facile studiare il compor- 
tamento di un’applicazione lineare, si tratta in sostanza di decidere se la pre- 
senza del termine 0(P— P) cambia il carattere di stabilità orbitale (nel senso di 
Lagrange, definito al paragrafo 2) dell’orbita periodica P. Il risultato più netto 
in questo campo è dovuto a Ljapunov, il quale provò che, nel caso di un si- 
stema hamiltoniano, se l’orbita per P è instabile anche nell’approssimazione li- 
neare, allora è instabile anche nel sistema completo. 

In tal caso perciò esistono orbite che si allontanano da P, e anche orbite che 
si avvicinano a P indefinitamente, formando una «varietà stabile» e una «va- 
rietà instabile». 

Ora la difficoltà consiste nel decidere che cosa accade delle orbite della va- 
rietà instabile per #-+ + co. Il fatto che esse si allontanino sulle prime da P non 
significa che si allontanino fino all’infinito; perché può capitare che la varietà 
stabile incroci la varietà instabile, cioè che una stessa orbita si allontani da P 


Figura 3. 


Punti omoclinici, cioè intersezioni di una varietà stabile con quella instabile relativa 
allo stesso punto fisso sulla sezione. ° 
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per poi tornare ad avvicinarsi indefinitamente alla stessa P (orbite «omoclini- 
che» nella terminologia di Poincaré). Perciò le due curve che sulla superficie 
di sezione individuano le due varietà, stabile e instabile, devono intersecarsi in- 
finite volte. Lasciando la parola a Poincaré stesso, « tali intersezioni formano una 
sorta di treccia, di tessuto, di rete con maglie infinitamente strette; ognuna del- 
le due curve non deve mai tagliarsi, ma deve ripiegarsi su se stessa in modo 
molto complesso per incontrare una infinità di volte tutte le maglie della rete. 
Si resterebbe allibiti dalla complessità di tale figura, che non cerco neanche di 
tracciare» [1892-99, III, p. 389]. 

Nella figura 3, violando il consiglio di Poincaré, si è cercato di dare un’idea 
della complicazione della situazione in presenza di orbite omocliniche. In que- 
sto caso si assiste al massimo possibile di instabilità: non solo l’orbita per Pè 
orbitalmente instabile, e cosî tutte le orbite nelle due varietà, stabile e instabile; 
ma neppure tale instabilità è una predizione stabile. Infatti la rete di cui parla 
Poincaré è infinitamente fitta, eppure non riempie alcun aperto sulla sezione; 
niente impedisce che per alcuni punti arbitrariamente vicini alla varietà insta- 
bile passino orbite periodiche, magari stabili. Anzi, a questo proposito vale la 
pena di citare la congettura (sempre di Poincaré) che le orbite periodiche sia- 
no dense in tutto lo spazio delle fasi. 

Purtroppo anche nel caso, del resto frequentemente verificato, che nella re- 
gione di instabilità «generata» da un’orbita omoclinica (cioè in realtà causata 
da una risonanza, con la sua capacità di accumulare nel tempo piccole forze 
producendo grandi effetti) si trovi un’orbita periodica con applicazione di Poin- 
caré linearizzata stabile, non è cosi facile concludere come nel caso instabile che 
l'applicazione di Poincaré completa ha lo stesso comportamento. Perciò la re- 
gione instabile, percorsa da punti omoclinici, può o meno contenere delle « isole » 
di stabilità attorno alle orbite periodiche linearmente stabili. 

Come è chiaro da questa descrizione, sia pure sommaria, le regioni di riso- 
nanza corrispondono a famiglie di orbite la cui complessità di comportamento è 
reale; le difficoltà logiche prodotte dalle risonanze, come per esempio la diver- 
genza delle serie perturbative (33), non sono un difetto della teoria ma il ri- 
flesso nella teoria dei sistemi hamiltoniani di enormi complicazioni insite nel 
comportamento delle soluzioni e inerenti alla natura del problema, non solo 
dal punto di vista matematico, ma anche dal punto di vista fisico. 

Dalla percezione di queste difficoltà, e non solo dalla mania di usare il cal- 
colatore ad ogni costo, nacque la moda degli «esperimenti numerici» su equa- 
zioni di Hamilton. 


6. La teoria di Kolmogorov-Arnol'd-Moser. 


Allora si immagini di compiere un esperimento col calcolatore su di un si- 
stema perturbato a due gradi di libertà: si prenda su di una sezione S un certo 
numero di punti P e si seguano le successive immagini dell’applicazione di 
Poincaré 0*(P). Si può rappresentare la situazione in due dimensioni, anche 
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se S ha dimensione 3, perché si può «eliminare» una variabile, cioè ricavarla 
dalla relazione che lega tra loro le variabili fornite da un integrale primo; per 
esempio la funzione di Hamilton è un integrale primo se non dipende diretta- 
mente dal tempo: si può usare una rappresentazione in coordinate polari, in 
cui per esempio /, è l’angolo e L, il raggio, supponendo che Li sia « eliminato ». 
Per u=o non occorre il calcolatore, naturalmente, perché l’immagine di un 
punto P si ottiene ruotando P di un angolo 27 ©,/0,, dove 0, sono le fre- 
quenze sul toro invariante su cui sta P: perciò se ©g/ W È razionale O (P) al 
variare di & passa solo per un numero finito di punti, se 01/609 è irrazionale 
©*(P) al variare di & «riempie» una circonferenza Ly= cost (cioè i punti otte- 
nuti per iterazione successiva di © sono tutti distinti e formano un insieme den- 
so nella circonferenza) (cfr. fig. 4). i 
Se invece . è piccolo ma diverso da zero, l’esperimento col calcolatore dà 
un risultato che dipende dal punto iniziale scelto P in modo molto complicato. 
In alcuni casi i punti ©*(P) sembrano individuare una curva, come a L=0, 
poco diversa da una circonferenza L,= cost. In altri casi i punti ©*(P), al cre- 
scere di &, sembrano per un po’ girare lungo quella che potrebbe anche essere 
una curva, ma poi — di solito all’improvviso — la « curva» comincia a oscillare e 
si «disfa» sotto gli occhi dello sperimentatore, mentre 1 punti 0*(P) si muovono 
in modo molto irregolare entro un’intera regione del piano. Osservare l'orbita 
©*(P) mentre viene calcolata su di un terminale video è veramente stupefa- 
cente se non si è preparati da una robusta base teorica ad accettare le stranezze 
dei sistemi hamiltoniani. . 
All’interno delle regioni «caotiche», in cui le orbite non sembrano giacere 
su curve invarianti, non vi è però un disordine uniforme, come per esempio 
un comportamento «ergodico», cioè un moto irregolare che però segue leggi 
statistiche semplici come quella che la probabilità di passare da ogni area unita- 


Figura 4. 
"Tracce dei tori invarianti a y=0 su di una sezione. 
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ria è la stessa. Infatti proprio nelle regioni caotiche, con il procedimento delle 
equazioni (38) e (39), si possono trovare delle orbite periodiche differenzia- 
bilmente isolate, che sono facilmente identificabili con quelle la cui esistenza è 
dimostrabile per «continuazione» per p piccolo. 

Non solo: ma alcune di queste orbite periodiche sono a loro volta circondate 
da «isole», cioè da regioni «ordinate» in cui i punti successivi ©*(P) si dispon- 
gono su «curve» invarianti, o per lo meno su corone circolari cosi strette da 
non consentire di decidere se il loro spessore sia reale o prodotto dall’accumu- 
lazione dell’errore numerico. 

Questo esperimento, che è stato presentato in forma ipotetica, è in effetti 
un tipo di esperimento realmente condotto da molti ricercatori partiti da pro- 
blemi apparentemente diversi — dal moto delle particelle elementari in un ac- 
celeratore del tipo ad anello, al moto delle stelle nella Galassia, alla dinamica 
del sistema solare — con grande interesse e polemiche, abbastanza inconsuete 
nel mondo scientifico, su cosa veramente venisse provato dai risultati ottenuti. 
Le regioni «ordinate», apparentemente composte da curve invarianti, erano 
realmente regioni in cui un nuovo integrale primo definiva superfici di livello 
su cui le orbite devono giacere? Tale congettura, apparentemente suggerita 
dagli esperimenti numerici, contrastava con i risultati di Poincaré e di Bruns 
sull’inesistenza di integrali primi oltre a quelli già noti. Anche non ammet- 
tendo l’esistenza di nuovi integrali primi, è però vero che nelle regioni ordinate 
esistono delle curve invarianti per ©, le quali separano lo spazio delle fasi in re- 
gioni sconnesse tra loro, e quindi assicurano un comportamento stabile delle or- 
bite, almeno nel senso che la regione in cui si muovono è ben delimitata? 

Malgrado alcune polemiche negli ambienti specialistici, l'evidenza contro 
l’esistenza di nuovi integrali primi era più che sufficiente sin dai tempi di Poin- 
caré, e la ragione è proprio la «biforcazione delle separatrici» descritta nel pa- 
ragrafo precedente: infatti tali fenomeni sono certamente impossibili in presen- 
za di un ulteriore integrale primo. Bisogna però riconoscere che un enunciato 
netto del tipo «questo sistema hamiltoniano con p=tot non ha altri integrali 
primi differenziabili» non è mai stato dimostrato. 

Il teorema di Poincaré, e in maniera più netta il teorema dimostrato in se- 
guito da Siegel, dicono una cosa meno precisa, che per alcuni è soddisfacente e 
per altri meno: cioè che nello spazio totale dei sistemi hamiltoniani (cioè nello 
spazio delle funzioni H) quelli che sono dotati di integrali primi indipendenti 
da H formano un insieme «magro» in qualsiasi ragionevole topologia. Ciò si- 
gnifica che, dato un sistema dotato di un integrale primo funzionalmente indi- 
pendente dalla hamiltoniana, è sempre possibile «perturbarlo », rendendolo pri- 
vo di integrali di tale tipo, con una perturbazione arbitrariamente « piccola», e 
questo risultato non dipende da quale delle molte definizioni di piccolezza delle 
perturbazioni si usa. Il senso intuitivo di questa affermazione è che la probabi- 
lità che un «generico» sistema hamiltoniano abbia un altro integrale primo è 
zero, ma purtroppo questa affermazione non si può rendere rigorosa senza de- 
finire in modo preciso che cosa significa «generico ». La formalizzazione del con- 
cetto di generico in effetti è possibile, ricalcando i metodi della geometria alge- 
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brica con una tecnica introdotta da Thom (si veda in particolare in questa stes- 
sa Enciclopedia l'articolo «Locale/globale», VIII, pp. 460 sgg.), però tale for- 
malizzazione fa appunto perdere il carattere intuitivo del discorso che si an- 
dava facendo. Forse l’unica interpretazione intuitiva dei teoremi di non-inte- 
grabilità è quella «fisica»: l’esistenza di un integrale primo distinto dalla hamil- 
toniana è instabile rispetto alle perturbazioni, perciò se anche fosse presente 
in un dato sistema hamiltoniano non sarebbe espressiva di una realtà che cer- 
tamente è modellata solo in modo semplificato dalle equazioni usate. 

Per queste ragioni l'indirizzo di ricerca più fecondo si rivelò il secondo ci- 
tato, cioè quello di tentare di dimostrare che le superfici invarianti che appari- 
vano tali negli esperimenti numerici erano reali. 

In linea di principio la tecnica, che fu sviluppata da Birkhoff [1927], è la 
stessa usata per integrare i sistemi integrabili mediante una soluzione S dell’e- 
quazione di Hamilton-Jacobi (19). Se però la hamiltoniana H è complicata, 
non c’è alcuna speranza d’integrare esplicitamente, per «separazione di varia- 
bili» o altrimenti, l'equazione a derivate parziali (19); resta solo la possibilità 
di trovare una soluzione mediante sviluppi in serie. Le serie impiegate sono ge- 
neralmente del tipo detto di Linstedt, cioè serie doppie, di Taylor nel parame- 
tro perturbativo u, e di Fourier nelle variabili angolo. Si è già visto uno sviluppo 
di questo genere nel paragrafo 4 con le formule (27) e (31): H viene sviluppata 
in serie, con per termine iniziale la hamiltoniana di un sistema integrabile e 
termini successivi sempre più piccoli (per p piccolo): 


(41) H(I,L)=H(L)+uR;(1,L)+0(u) 


mentre la funzione perturbatrice R, è sviluppata in serie di Fourier, cosi come 
i termini successivi: 


(42) Ri(L)=Y Bs(L) cxp(ih-1). 


Nella (42) si è generalizzato la (31) al caso di anche più di due variabili angolo 
1, usando un «multi-indice» h, cioè un vettore a componenti intere h= (4, 
..., hy), ma il lettore non si faccia distrarre da questi trucchi del mestiere del 
matematico e pensi semplicemente a funzioni trigonometriche dipendenti da 
una combinazione di variabili angolo. Allora una trasformazione canonica che 
riduce H alla forma dipendente solo da nuove variabili azione L' è definita 
da una funzione generatrice .S(1,L') che soddisfa all’equazione di Hamilton- 


Jacobi 
(43) H(1 1) xa) 


Se ora si suppone di sviluppare la funzione generatrice incognita .S a sua 
volta in una serie di Linstedt, si ottiene con le solite notazioni 


S(1,L')= } 5L;+w.S(1,L')+0(U) 
(4) SL) = C,(L') exp(ih-1). 
h 
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Adesso sostituendo gli sviluppi in serie (41), (42), (44) nella (43) ed eseguendo 


un po’ di conti, si ottiene: 


65) Ho(l)ta|RA1)+ ESTR] +0() = K1); 


perciò, per eliminare la dipendenza da u nel primo membro a meno di termini 
contenenti u? (e perciò «più piccoli»), basta annullare la parte tra parentesi; 
se si nota che (dH7;/dL;)= ®; sono le frequenze del sisiema imperturbato, si 
trova un'equazione che lega S, a R,, e conduce su ogni termine delle rispettive 
serie di Fourier alla condizione 


i 


da cui segue la soluzione «formale» espressa in serie di Fourier per S,: 
(B,(L') ; 
(47) S(1,L)= Y = exp(ih-1). 
1( ) DI, Vo; P( ) 
bl 


Con la (47) si è arrivati allo stesso punto a cui si era arrivati con la (33) nel pa- 
ragrafo 4; cioè a una serie che può benissimo divergere per la presenza del 
«piccolo denominatore » Lo jh;, anzi è priva di senso alla risonanza, cioè quan- 


do il piccolo denominatore è zero. Perciò la serie (477) sarà certamente diver- 
gente per certi valori di L’ per i quali gli ;= (dH/dL;)(L') assumono valori 
con rapporti molto ben approssimabili con i razionali, e poiché tali numeri 
sono densi nei reali questo rende del tutto impossibile la convergenza delle serie 
(47) su di una regione aperta dello spazio delle fasi. Però se ci si limita a richie- 
dere che la convergenza si verifichi su di un particolare toro del sistema integra- 
bile, cioè per valori di L’ — e quindi delle frequenze w; — fissati, e per 1 qualun- 
que, allora si può scegliere L' in modo che gli +; siano non solo tali da non an- 
nullare il piccolo denominatore (nel caso a due soli angoli, &/twy irrazionale), 
ma anche tali da non renderlo troppo piccolo per valori bassi degli indici 4, 
e quindi da far convergere le serie. 
Il procedimento dimostrativo è in effetti molto complicato, ed è basato su 
di una sorta di generalizzazione del metodo di Newton applicato a spazi fun- 
zionali [cfr. Moser 1973]. Ci si limita a citare il risultato, nella forma più sem- 
plice, annunziata da Kolmogorov nel 1954 e in seguito provato ed ampliato da 
Arnold e da Moser: se le frequenze ©; sono tali che per ogni multi-indice 
h#0 
8 ahj>= 
(48) p3 sh IDE 
î 
per qualche fissato c, d maggiore di zero, e inoltre la hamiltoniana impertur- 
bata H, è regolare e non degenere nel senso che la matrice d°7H,/dL;dL; è 


| a determinante diverso da zero, allora la serie (47) converge, per p abbastanza 
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piccolo e cosi le analoghe relative alle potenze più alte di u. Perciò esiste una fun- 
zione S= .S(1,L'), solo per il valore dato di L’, e la legge di trasformazione 


òS ds 
= O LL th CO (LI 


con L’ costante, definisce un’applicazione dal toro di variabili angolo 1’ nello 
spazio delle fasi di variabili (1,L) [cfr. Arnol'd 1974]. 

Per comprendere il significato di questa applicazione definita dalle (49) oc- 
corre osservare che nel sistema di hamiltoniana K(L') le L sarebbero integrali 
primi. Ora tale sistema non può essere definito in grande, ma solo per valori 
fissati delle L:: allora a tali valori corrispondono dei tori invarianti che restano 
tali anche nel sistema di hamiltoniana H(1,L) e che sono parametrizzati dalle 
(49). Questi tagliano, nel caso a due gradi di libertà, le curve invarianti sulle 
superfici di sezione, che gli esperimenti numerici facevano ipotizzare. 

Si tratta ora di trarre delle conclusioni dal punto di vista della stabilità: la 
teoria di Kolmogorov-Arnol'd-Moser consente di ottenere risultati «stabili» 
nei problemi hamiltoniani perturbati, come per esempio quello dei tre corpi? 

La risposta è, per l'ennesima volta, non cosi netta come si potrebbe sperare. 
Per convincersene si ritorni un momento al caso di due sole variabili angolo, e 
alla rappresentazione schematica della figura 5 visto che teoria ed esperimenti 
numerici convergono nell’indicazione di una struttura complicata delle solu- 
zioni come quella disegnata. Anzi: di una struttura infinitamente complicata, di 
cui il disegno dà solo un’idea molto parziale (come diceva Poincaré). 

Nessuna regione della superficie di sezione è completamente riempita da 
curve invarianti, perché i razionali sono densi, e quindi tra due curve invarianti 
conservate dalla perturbazione vi sono sempre dei tori «distrutti» e sostituiti 


Figura 5. 


Regioni ordinate e regioni caotiche, viste su di una sezione. (Da Arnol’d e Avez 1967). 
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da orbite periodiche isolate. Perciò se le condizioni iniziali di un’orbita stanno 
su di una curva invariante, l’orbita starà sempre su tale curva invariante, e per 
di più le serie del tipo (33) oppure (47) forniscono un modo operativo di calco- 
lare l’orbita per un tempo arbitrariamente lungo con precisione arbitrariamente 
grande. Se però le condizioni iniziali cambiano anche solo di pochissimo, può 
accadere che l’orbita vada a cadere in una regione « caotica» generata da una ri- 
sonanza, e perciò le predizioni basate sulle formule del tipo (33) 0 (47) non sono 
stabili nel senso rigoroso del termine. Però se una «regione caotica» è a forma 
di corona circolare, limitata all’interno e all’esterno da due curve invarianti, 
un’orbita che parte in tale regione dovrà per forza restare confinata tra le due 
curve invarianti. Se la regione compresa tra due curve invarianti è molto sottile, 
l’orbita che oscilla in tale corona sarà si instabile, nel senso che non sarà possi- 
bile controllare il suo movimento all’interno della corona, ma l'ampiezza di 
tale instabilità sarà determinata dall’ampiezza della corona e perciò molto pic- 
cola. In altre parole si pone il problema inverso di quello che ci si era posti di 
fronte ai risultati degli esperimenti numerici: se il risultato è instabile, ma in pra- 
tica l’instabilità è cosi piccola da confondersi con gli errori che si commettono 
nei calcoli, e molto più piccola degli errori osservativi, allora il risultato è prati- 
camente stabile. 

Anche questo risultato, positivo sebbene ambiguo, è però dotato di una 
validità limitata. Infatti se si torna al caso generale di 2n variabili, n>2, i tori 
invarianti sono ancora presenti (in questo caso tori di dimensione n>2) però 
due tori vicini non delimitano una regione di spazio delle fasi che sia invariante, 
come nel caso di due circonferenze nel piano. Perciò le orbite che partono dai 
varchi, aperti dalle risonanze nel tessuto dei tori invarianti, possono passare tra 
toro e toro e sfuggire lontano, dando luogo anche alle forme più plateali d’in- 
stabilità, come per esempio sfuggire all’infinito o verso una singolarità (diffu- 
sione di Arnold). 

Perciò questa ricerca sulla stabilità del problema degli x corpi (e di tutta la 
classe dei sistemi hamiltoniani «perturbati») non ha ancora avuto una conclu- 
sione. Per concludere con una battuta (ripresa da Roy) il problema degli x 
corpi, accusato di stabilità, è assolto per insufficienza di prove. Ma il processo 
continua. [A.M.]. 
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Non esiste una definizione rigorosa di ‘stabilità’ che comprenda tutti i casi in cui 
questo termine è usato nella ricerca scientifica contemporanea (cfr. scienza). Nei la- 
vori dei matematici si trovano invece molte definizioni di solito differenziate l’una dall’al- 
tra mediante vari attributi, e l’unico metodo praticabile per giungere all’unità è quello 
di ricorrere a una definizione di carattere metamatematico (cfr. logica, linguaggio); 
questo modo di procedere non è però ugualmente ben accetto a tutta la comunità scien- 
tifica (cfr. paradigma, spiegazione). 

Una proprietà definita nell’ambito di una struttura matematica (cfr. strutture ma- 
tematiche) è di stabilità o di instabilità se essa individua, in senso positivo o negativo, 
l’attitudine di un oggetto matematico (cfr. anche formalizzazione) della struttura stes- 
sa ad essere impiegato come modello della realtà (cfr. reale), ove ‘modello’ è inteso in 
senso strettamente empirico (cfr. empiria/esperienza) e operativo (cfr. operazioni, 
operatività). Ma un modello può anche essere costituito da un’equazione — nel senso 
generalizzato di relazione tra diverse variabili a valori in oggetti di una teoria matematica 
data (cfr. teoria/modello, matematiche) - e dall’interpretazione di alcune variabili 
in gioco come grandezze osservabili (cfr. osservazione, simulazione, legge, teoria/ 
pratica). Determinare un limite massimo (cfr. soglia) per l’errore di predizione intro- 
dotto dall’approssimazione è il problema della stabilità; in particolar modo il problema 
sarà stabile se l’errore di predizione dipenderà in modo continuo dalle approssimazioni 
introdotte (cfr. funzioni, continuo/discreto, ma anche dipendenza/indipendenza, 
calcolo). Va osservato che l’instabilità stessa può essere stabile, e quindi costituire una 
previsione (cfr. previsione e possibilità) legittima: questo è il tema della teoria della 
stabilità più raffinata, la teoria delle catastrofi (cfr. anche locale/globale, qualità/ 
quantità). 

In questo articolo ci si riferisce a quello che è forse il più celebre di tutti i modelli 
matematici del mondo fisico (cfr. fisica), quello che descrive un sistema di corpi ce- 
lesti, come per esempio il sistema solare (cfr. astronomia, cosmologie, gravitazione, 
moto, pianeti, sole), e le considerazioni matematiche che vi intervengono (cfr. dif- 


ferenziale, infinitesimale, variazione) sono finalizzate a una descrizione quanto più 
possibile adeguata. 


Variazione 


Il fisico sperimentale indaga la natura scoprendo via via i suoi fenomeni e 
formulando le leggi che li descrivono. Il matematico ha la presunzione di ren- 
dere evidente perché un fenomeno ubbidisce a una legge piuttosto che a un’al- 
tra. Pertanto il matematico è spinto a considerare le ipotetiche variazioni delle 


leggi fisiche. 


1. Indagine dei fenomeni fisici mediante i metodi della matematica. 


Nella maggioranza dei casi, i fenomeni fisici vengono descritti da applica- 
zioni o funzioni (si veda l'articolo « Applicazioni » in questa stessa Enciclopedia). 
Nei casi più semplici queste funzioni rappresentano la configurazione di un og- 
getto o l’evolvere di un fenomeno al variare del tempo. Ad esempio la configu- 
razione di equilibrio di una corda di un piano (x, y), fissata agli estremi (a, 0), 
(b, 0) e sottoposta all’azione di forze che agiscono nella direzione dell’asse y, 
può essere descritta da una funzione y =f(x), xe [a,b] =I, dove f(a)=f(0)=o0. 
Il moto di una particella materiale (identificata con un punto P) è descritto da 
una funzione che fornisce la posizione del punto nei vari istanti di tempo: 
P=P(t). Questa funzione che descrive il moto si ottiene, almeno negli stadi 
iniziali della scienza, interpolando diverse misure in tempi diversi. Si pensi alle 
esperienze di Galilei sulla caduta dei gravi. 

Ma in uno stadio più avanzato nasce l’esigenza di esprimere la legge del mo- 
to non solo in base alle misure ripetute dell’esperienza; occorre trovare delle 
leggi generali che ci facciano conoscere le funzioni che lo descrivono. Nascono 
cosi le leggi generali della meccanica. 

Per poter esprimere queste leggi generali occorre considerare non solo le fun- 
zioni che rappresentano il fenomeno, ma anche alcune particolari forme lineari 
o di grado superiore che si ottengono da queste mediante le variazioni locali. 

L'idea di variazione, che si può ritrovare fin agli albori del calcolo infinite- 
simale, è alla base anche delle teorie più moderne con diverse nomenclature. 
Oggi si parla piuttosto di incrementi, di differenziali, di test functions, ecc. ecc. 
Sono queste nozioni che permettono di dedurre le evoluzioni di un punto ma- 
teriale se il suo stato e la velocità al momento iniziale del moto sono noti. Ciò 
si collega alla teoria matematica delle equazioni differenziali ordinarie e al co- 
siddetto problema di Cauchy. 

S’incomincerà con il prendere in esame un classico problema di ottica, ac- 
cettando l'osservazione che la luce procede in linea retta se non ci sono ostacoli 
sul suo cammino e che i raggi non interferiscono l’uno con l’altro; e si studierà 
il comportamento della luce quando colpisce vari materiali. L’oggetto più sem- 
plice è uno specchio. Quando la luce ne colpisce uno, essa viene respinta in una 
nuova linea retta che varia quando viene cambiata l’inclinazione dello specchio. 


963 Variazione 


I due raggi, quello incidente e quello riflesso, sono tali che gli angoli che ciascu- 
no di essi forma con la normale allo specchio nel punto d’incidenza sono uguali. 
Inoltre i due raggi e la normale sono nello stesso piano. 

Un problema più difficile s'incontra quando la luce passa da un mezzo a un 
altro, per esempio dall’aria all'acqua; anche qui si vede che la luce non si pro- 
paga in linea retta, ma nell’acqua il raggio s’inclina rispetto al suo percorso nel- 
l’aria. Indicando con $; l'angolo che il raggio di luce nell’aria forma con la nor- 
male alla superficie di separazione fra l’aria e l’acqua e con ®, l’angolo che il 
raggio di luce nell’acqua (raggio rifratto) forma con la stessa normale, la rela- 
zione fra l’inclinazione dei due raggi è data dalla formula 


sind; 
sind, 


=k=costante. 


Anche in questo caso i due raggi e la normale sono nello stesso piano. 

Ora, nell’ulteriore sviluppo della scienza, si richiede qualcosa di più di una 

semplice formula. Dapprima sono state fatte delle osservazioni, poi si hanno 
delle misure che convalidano l’osservazione e quindi si ha una legge che com- 
pendia tutte le misure. Ma la vera aspirazione della scienza è di trovare un mo- 
do di pensare che renda evidente la legge. 
__ Hl ragionamento che rese evidente la legge sul comportamento della luce è 
il principio di Fermat, chiamato anche principio del tempo minimo. L’idea di 
Fermat è questa: fra tutti i possibili cammini che la luce può seguire per anda- 
re da un punto a un altro, essa segue il cammino che richiede il minor tempo. 
In altre parole, se la luce va da un punto A a un punto B seguendo un certo 
cammino, ogni variazione fa impiegare alla luce un tempo maggiore. 

Da questo principio discende dapprima la legge della propagazione in linea 
retta. È possibile verificare che da esso discende anche la legge di riflessione 
dello specchio. Nella figura 1 sono indicati due punti A e B e uno specchio 


bo 


& 


{fie:> f ietetai niente etnei PECE TETTE 


Figura 1. 


La somma delle lunghezze AE + EB è minima, perché è minima la somma AE+EB'. 
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piano MM". Quale è il modo per andare da A a B nel più breve tempo possi- 
bile? Evidentemente andare in linea retta da A a B. Ma si aggiunga la condi- 
zione in più che la luce deve colpire lo specchio e ritornare nel più breve tempo 
possibile. A 

Un modo potrebbe essere di andare il più rapidamente possibile allo spec- 
chio e quindi andare in B, lungo il cammino ADB. Naturalmente si ha allora 
che il tratto DB è lungo. Se ci si sposta un po’ a destra di D fino ad E, si aumen- 
ta leggermente la prima distanza ma diminuisce di più la seconda, e cosi la lun- 
ghezza totale, e quindi il tempo impiegato nel percorso, è minore. Quale sarà il 
punto C per il quale il tempo è minimo? Lo si può determinare con una sem- 
plice considerazione geometrica. 

Si consideri il punto B' simmetrico di B rispetto ad MM”. Poi si tracci il 
segmento EB’. Quindi la somma delle due distanze AE+ EB, che è proporzio- 
nale al tempo impiegato dalla luce per percorrerla a velocità costante, è anche 
la somma delle due lunghezze AE+ EB". Quindi il problema consiste nel deter- 
minare il punto E in modo che la somma delle due lunghezze sia minima. La 
risposta diventa cosi molto semplice: quando il segmento EB' è sul prolunga- 
mento del segmento AE; ciò avviene quando E è nell’intersezione C del seg- 
mento 48’ con MM'. Qui l'angolo che AC forma con la normale è uguale a 
quello che CB’ (e anche CB) forma con la stessa normale. Cosi l’affermazione 
che l'angolo d’incidenza è uguale all’angolo di riflessione è equivalente all’af- 
fermazione che la luce va allo specchio in modo tale da giungere in B' nel minor 
tempo possibile. Poiché la velocità della luce è costante, invece di rendere mi- 
nimo il tempo si è cercato di rendere minimo il cammino della luce. 

Per la rifrazione, la luce non segue il percorso di minima distanza in quanto 
la velocità della luce nell’aria è diversa (maggiore) dalla velocità che essa ha nel- 
l’acqua. 

Siamo cosi ricondotti a un problema della natura seguente. Siano assegnati, 
in un piano, due punti A e B da parti opposte rispetto a una retta r (fig. 2). Un 
punto mobile va da A ad un punto P della retta 7 con velocità v e da tale punto 
al punto B con velocità w. Si cerca quale è il cammino che viene percorso nel 
minor tempo possibile. 


Figura 2. 
Il tratto AP è percorso con velocità v, il tratto PB con velocità w. Il tempo totale è 
il minimo possibile. 
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Figura 3. 


La curva rappresenta il tempo impiegato in funzione della posizione di P. Al punto 
C corrisponde il più breve tempo possibile. 


Indicando con tf, e #, i tempi impiegati a percorrere i cammini AP e PB e 
con £ il tempo totale si ha: 


o pela SEE 
CR tg 


Si tratta dunque di trovare il punto P su 7 in modo che il tempo # corrispon- 
dente al cammino APB sia il più piccolo possibile. Sia C la posizione del punto 
P che fornisce il valore minimo per #: questo significa che spostando su r il 
punto P dalla posizione C' il cammino APB è percorso in un tempo maggiore. 

S'immagini di riportare su un grafico il tempo impiegato in funzione della 
posizione del puntò P. Si ottiene una curva del tipo indicato nella figura 3. Al 
punto C' corrisponde il tempo più breve possibile. Con alcune semplici consi- 
derazioni di analisi matematica, alle quali si accennerà in seguito, risulta che il 
punto C è l’unico punto sull’asse 7 dove la variazione è nulla ed in corrisponden- 
za di esso è soddisfatta la legge di rifrazione della luce. 

Il problema considerato è abbastanza semplice, perché i cammini della luce 
vengono individuati dalla posizione del punto P sull’asse r, cioè da una sola 
variabile in quanto la luce si muove in linea retta nell’aria e nell’acqua con ve- 
locità costanti. Le considerazioni fin qui svolte spingono a soffermarsi sull’ana- 
lisi dei punti di minimo di una funzione f(x). 


2. Punti stazionari di una funzione. 


Sia f(x) una funzione reale definita in un intervallo / dell’asse reale. Ciò vuol 
dire che a ogni numero reale x dell’intervallo Y corrisponde un numero reale. 
Introdotto un sistema di assi cartesiani (x, y), dopo aver fissato le unità di 
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misura su di essi si consideri l’insieme G dei punti (x, f(x)) al variare di x in /. 
Questo insieme che costituisce il grafico della funzione f(x) ha la proprietà che 
ogni retta parallela all’asse y incontra G in un punto al più. Viceversa, un insie- 
me G che gode della suddetta proprietà determina una funzione f(x). I valori 
di x per i quali la retta, parallela all’asse y, passante per il punto (x, 0) incontra 
G è il dominio della funzione. Per semplicità si considereranno funzioni il cui 
dominio sia un intervallo /=[a,5]{x: a<x<b)}, dove i punti x per cui a<x<b 
sono i punti interni all’intervallo mentre a e 5 sono i due estremi. 

Sia x, un punto interno all’intervallo I e P = (x, f(xo)) il punto corrispon- 


Q 


P= (xo, f(%0)) 


permea 


ti 
di x È o 10 dente di G (fig. 4). S’immagini di fotografare l'insieme G inquadrando un ret- 
tangolo intorno a P e ottenendo una diapositiva tale che il punto P sia nel cen- 
Figura 4. Figura 5. tro di essa (cioè nel punto d’incontro delle due diagonali) (fig. 5). Si proietti 
G è il grafico di una funzione. P ha le coor- Il rapporto di ingrandimento « viene au- ora questa diapositiva su uno schermo aumentando sempre di più il rapporto 
dinate (xo, f(x0)). mentato sempre di più. d’ingrandimento «. Questi ingrandimenti rivelano, esaltandolo sempre di più, 


il comportamento dell’insieme G vicino al punto P. Accade nella generalità dei 
casi che questi ingrandimenti «tendono » a divenire sempre più una linea retta 
passante per il punto P, il quale rimane fisso nel procedimento di ingrandi- 
mento (fig. 6). Questa retta che cosi si ottiene svolge un ruolo di primaria im- 
portanza nello studio della funzione f(x). 

Non è possibile nella pratica spingere l’ingrandimento oltre un certo valore, 
ma non si hanno difficoltà teoriche a pensare che ciò possa avvenire. In questo 
fatto è racchiusa l’idea di limite. 

La retta alla quale si è giunti con questo procedimento ha un’equazione 
y=f(x)+m(x—xg), dove m misura l'inclinazione della retta stessa, cioè m = 
=tg9, dove 3 è l'angolo che la retta forma con l’asse x. Questo numero m è 
la derivata della funzione f(x) nel punto x, cioè 


RESA SERI 


+ ST®)S(%0) 
2 m=f'(x)=lim 
(a) SG) = im LI 
L'espressione m(x— x) è una forma lineare nella indeterminata x—x, e 
prende il nome di differenziale della funzione nel punto x). 
La definizione matematica è la seguente: 


DEFINIZIONE. La funzione f(x) è differenziabile (cioè dotata di differenziale in 
un punto xp) se esiste una forma lineare, nella indeterminata h, m-h tale che, posto 


(3) w(A)=f(x0+h1)-f(x)-m-h, 


risulti 


(4) lim Sol =o0. 


h+0 


Di qui discende 


n Lt) SG) (A) 
h h 


Figura 6. 
Gli ingrandimenti «tendono » ad essere rettilinei. 


e quindi la (2). 
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La (3) fornisce un'informazione sulla variazione del valore della funzione 
f(xo+h)-f(x0) in corrispondenza della variazione 4 della variabile x nelle vi- 
cinanze di xy, cioè 


F(xo+h)—f(x0) =m-h+ (h) 


dove ©(4) è molto piccolo rispetto alla variazione %. 

Quindi m-% descrive, in prima approssimazione, il comportamento della va- 
riazione f(x°+4)—f(x) per 4 molto piccolo. 

La definizione matematica del differenziale di una funzione in un punto xy 
traduce proprio la considerazione intuitiva fatta all’inizio di questo paragrafo. 

In un sistema di assi cartesiani con l’origine nel punto P e con gli assi pa- 
ralleli a quelli originari, l'ingrandimento di f(x), di rapporto «, genera la fun- 


ela | 
23) fo] 


Questa nuova funzione f altro non è se non la funzione data f rappresentata in 
un sistema di assi cartesiani quando le unità di misura sono ingrandite nel rap- 
porto a. Il fatto che f(x) tenda per « sempre più grande alla retta y =m(x— xo) 
equivale proprio alla condizione (4). 

Si è considerato il differenziale in un punto x, interno all’intervallo di de- 
finizione della funzione, ma è possibile introdurre il differenziale anche in un 
estremo dell’intervallo come limite dei differenziali nei punti interni vicini al- 
l'estremo considerato. Il differenziale in un punto x) dipende ovviamente solo 
dal comportamento della funzione nei punti vicini ad xg. 

All’inizio di questo paragrafo si è identificata una funzione f(x) con il suo 
grafico G, ma la realizzazione di G, data la funzione f(x), non è, in generale, un 
problema semplice, per cui si presentano degli interrogativi tendenti a chiarire 
il comportamento della funzione nelle vicinanze di un suo punto xo, interno al- 
l’intervallo di definizione. A molti di questi quesiti si può dare una risposta per 
mezzo del suo differenziale. Ad esempio, la funzione f(x) nel punto x, assuma 
il valore yo, cioè yo =f(x0). Per valori di y vicini ad y, ci sono ancora valori x, 
vicini ad x, dove f(x)=y? Il risultato al quale si giunge è evidente se visto sul 


grafico di f(x). 


f(x) na|i(s+ 


TEOREMA. Se il differenziale di f(x) nel punto x, interno al suo intervallo di 
definizione non è identicamente nullo, per ogni y vicino ad yy esiste un valore x, 
vicino ad x), dove f(x)=y. 


Si osservi che dire che il differenziale non è identicamente nullo equivale al 
fatto che l’equazione 
(5) m-h=k 


ammette sempre una e una sola soluzione, qualunque sia &. In altre parole, sa- 
pendo che f(x) =%y si può dedurre che l’equazione non lineare f(x) =y am- 
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mette una soluzione, nelle vicinanze del punto (xo, yo), dalla considerazione che 
l'equazione lineare (di primo grado) (5) ammette sempre una soluzione unica 
qualunque sia il secondo membro. 

Si passi ora alle definizioni seguenti: 


DEFINIZIONE. Una funzione f(x) possiede un minimo nel punto x, se per tutti 
i punti x che sono sufficientemente vicini ad x, si ha f(x)=f(x0). 

DEFINIZIONE. Una funzione f(x) possiede un massimo nel punto x, se per tutti 
i punti x che sono sufficientemente vicini ad x, si ha f(x)<f(x0). 


A questo proposito si ha il seguente teorema: 


TEOREMA. .Se la funzione f(x) ha un punto di massimo (di minimo) in un pun- 
to x interno all'intervallo di definizione dove esiste il differenziale, il suo differen- 
ziale è identicamente nullo, cioè m=f'(x;) =0. In altre parole la retta y=f(x0)+ 
+m(x-—x0) è parallela all'asse x. 


È essenziale nell’enunciato precedente che il punto xy sia interno all’inter- 
vallo di definizione della funzione. Ad esempio la funzione y =x considerata 
nell’intervallo [o, 1] ha il minimo nel punto o dove il differenziale non è iden- 
ticamente nullo. 

Si osservi che possono esservi dei punti dove il differenziale esiste ed è iden- 
ticamente nullo, ma la funzione non ha né punti di massimo né punti di minimo. 
Questi punti si chiamano punti stazionari della funzione (cfr. fig. 7). Quei par- 
ticolari punti stazionari che sono anche punti di massimo o di minimo si chia- 
mano punti estremanti. 

Appare chiara l’importanza di saper calcolare le derivate (e quindi i diffe- 
renziali) delle funzioni. Ogni corso di analisi matematica fornisce le regole di 
calcolo delle derivate: si tratta di semplici regole che ogni poinena che voglia 
utilizzare la matematica deve conoscere. 

A titolo di esempio si ritorni al problema della rifrazione della luce conside- 


Figura 7. 


P è un punto stazionario della funzione. 
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rato nel $ 1 (fig. 2). Siano p, gq le distanze di A e B dalla retta r, A’, B' le proie- 
zioni ortogonali di A e B su 7, x la distanza di P da A' contata positivamente nel 
verso da A' a B'. Posto A'B'=£, il tempo complessivo impiegato a percorrere 
il cammino AP+PB è dunque, in funzione di x, 


(= {0 PIE, VERE 


Derivando f(x) si ha: 


v w 


x lex 


VV p°+ x? wV q+ (x) 


S(x)= 


e questa derivata si annulla quando vale l’uguaglianza 
x lx 


OVP+a wVP+ (0%) 


la quale esprime che gli angoli 8, e è, che AP e BP formano con la normale in 
P alla retta soddisfano la relazione 


sind, ® 


sind, w' 


Questa relazione esprime appunto la legge di rifrazione della luce e spiega che 
la costante & è il rapporto della velocità della luce nell’aria e nell’acqua. Essa è 
approssimativamente 1,33. 

Si è considerato il teorema dei massimi e dei minimi; esso fornisce una con- 
dizione necessaria perché una funzione abbia un punto di minimo interno al- 
l'intervallo di definizione. Se si fa cadere la restrizione che x, sia interno all’in- 
tervallo, il risultato è il seguente: 


TEOREMA. Se la funzione f(x), differenziabile in un intervallo I, ha in x, un 
punto di minimo, allora 


(6) Fo) -x)=0  perogni xeI. 


Quando x, è interno ad /, dalla (6) segue, poiché il fattore (xx) può cam- 
biare segno, che f'(x9) =0. Se x, coincide con il primo estremo a, segue, poiché 
Il fattore xa è non-negativo, che f'(a)=o. Se invece x, coincide con il se- 
condo estremo d, segue che f'(b)<o. 

Nell’enunciato di questo teorema si vede bene che nel caso di un punto xy 
interno all’intervallo di definizione le variazioni «ammissibili» sono arbitrarie, 


mentre nel caso che x, cada in un punto estremo dell’intervallo di definizione- 


sono ammissibili solo alcune variazioni. Nel caso che x, =a la variazione x—xy 
può assumere soltanto valori positivi, mentre nel caso x = la variazione x—xg 
può assumere soltanto valori negativi. 

Sono stati cosî presentati alcuni risultati del calcolo differenziale di una fun- 
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zione di una sola variabile in una forma che si presta bene a varie generalizza- 
zioni che costituiscono aspetti tra i più interessanti della matematica moderna. 
Si vedrà ora come esse possono presentarsi in contesti più generali. 


3. Funzioni di più variabili. 


Sempre rimanendo nel campo dell’ottica, si supponga di avere due specchi 
paralleli s, e s, con le superfici riflettenti rivolte l’una contro l’altra (fig. 8). Una 
situazione di questo genere può succedere di trovarla nelle botteghe dei barbieri. 
Un raggio di luce, partendo da A, arriva a B dopo essersi riflesso prima su sj e 
poi su sy. Fra tutti i cammini soddisfacenti a queste regole trovare quelli di lun- 
ghezza (e quindi di tempo) minima. I cammini «ammissibili » in questo proble- 
ma sono del tipo AP,P,B. 

Dette x, e x, le distanze di P, e P, dalla retta perpendicolare agli specchi 
passante per A, la lunghezza del cammino considerato è un numero che dipen- 
de, fissati A, B e gli specchi, da x, e xy. 

Si tratta quindi di considerare una funzione di due variabili x,, xy definita 
in un quadrato Q0={o<x,<£ o<x,<4£} (dove L è la distanza su uno degli 
specchi di A da B). 

Una funzione f(x,, x,) definita nell'insieme O delle coppie (x,, x) tale che 
o<x,<£, o<x,< associa a ogni coppia (x,, x3) un numero reale. 

Introdotto un sistema di assi cartesiani (x,, x, y), si consideri l’insieme G 
dei punti (x,, x, f(x1,%2)) al variare di (x, x9) in Q. Questo insieme costituisce 
il grafico della funzione; esso è un insieme dello spazio a tre dimensioni. 

Analogamente al caso considerato nel $ 2, il principio di Fermat conduce a 
ricercare quelle coppie (x9, x?) di O dove la funzione f(x,, x3) è minima, cioè 
F(%1,%2)=f(x9,x0) per ogni coppia (x,, xs) vicina a (9, 29). 

Questo problema, come nel caso precedente, si può risolvere facilmente con 
considerazioni geometriche. Sia s} la retta simmetrica di s, rispetto allo spec- 
chio sy, sia B' il simmetrico di B rispetto allo specchio sj e B” il simmetrico di 
B' rispetto alla retta s) (fig. 9). La lunghezza del cammino AP,P,B è uguale 
alla lunghezza del cammino AP,PjB"”. Questo secondo cammino sarà minimo 
quando i punti AP,P3B” sono allineati e di qui discende che i punti P, e P, de- 


Figura 8. 


s, ed s, sono specchi paralleli con le superfici riflettenti rivolte l’una contro l’altra. 
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vono essere tali che in ciascuno di essi sia rispettata la legge di riflessione del- 
la luce. 

Se invece dei cammini che vanno da A a B dopo due riflessioni si conside- 
rano cammini che vanno da A a B dopo tre o più riflessioni, si è ricondotti in 
maniera analoga a considerare funzioni di più variabili. 

La stessa situazione si presenta se ci si propone di considerare il cammino 
che la luce percorre per andare da un punto A a un punto B attraversando un 
numero finito di mezzi trasparenti ma di natura diversa. 

Anche in questi casi si è condotti a considerare il differenziale di una funzio- 
ne di più variabili seguendo il suggerimento di quanto detto nel caso di una 
funzione di una variabile. 

Sia f(x), dove x sta per le n-ple (x1, xo, ..., x), una funzione a valori reali 
definita per tutti gli x vicini ad x = (x9, 28, ..., x9). Si consideri la famiglia di 
funzioni, dipendenti da un parametro a>o, ; 


; h 
{0 =a|1(x43) sn 
dove 4 = (ky, hg, ..., hp). 
Se per a tendente all'infinito queste funzioni tendono a una forma lineare 


(7) Ah= Ah, +Aghg+...+Anfn 


la funzione f(x) si dice differenziabile in x) e la forma lineare (7) si chiama il 
differenziale di f(x) in x. Le quantità A4,, A», ..., 4, che dipendono da xo, 
sono le derivate parziali di f in xy e si indicano con i simboli f,, fx) +» Fim Pe 
pure con i simboli 


AR DI 


, dee 
dx, dxg dx, 


Figura 9. 


Anche in questo caso il problema del tratto ottimale (AP,P,B) è risolto con semplici 
considerazioni di simmetria. 
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Una funzione f(x) ha un minimo (massimo) in x, se f(x)=>f(x0) (<) per 
tutti i valori di x vicini a x,. Sussiste un teorema analogo a quello di p. 969: 


TEOREMA. Se la funzione f(x) ha un minimo (massimo) in x, ed è ivi differen- 
ziabile, il suo differenziale è identicamente nullo. 


Sia f(x) un’applicazione di R” in R”*; ciò vuol dire che ad ogni n-pla x = (x, 
X9, «+, Xy) corrisponde una n-pla y = (7, Ya, --.: In). Si è così condotti a consi- 
derare x funzioni f(x) = (f(x), fe(x), .... fa(x)). L'applicazione f(x) è differen- 
ziabile in x, se ciascuna funzione f(x), î=1, 2, ..., n, è differenziabile in xg. Il 
differenziale dell’applicazione f(x) è l'applicazione lineare 


N . 
YVAi;h; î=1,2,..,7 
fa 


che applica R” in R”. I coefficienti A,; sono le derivate parziali df;/dx; della 
funzione f; rispetto alla variabile x; calcolate in xo. 
Un teorema analogo a quello di p. 968 permette di affermare: 


TEOREMA. Sta f(x) un'applicazione di R" in R" tale che f(x) =v0- L’applica- 
zione sia differenziabile e inoltre il sistema lineare 


N 
LAgh;=Rk; 1=1,2,...,7 
3=1 


ottenuto uguagliando il differenziale in x, alla n-pla R,, ..., k, ammetta una e una 
sola soluzione per ogni valore di k,, ..., Rn. Allora il sistema non lineare 
F(X1 %9) 3, Xn) =Y t=1,2,...,% 


ammette un'unica soluzione vicino ad x, per ogni y vicino a yo 


4. Spazi di dimensione infinita. 


La configurazione di un ente fisico non è sempre descrivibile con un nume- 
ro finito di parametri come accadeva negli esempi considerati nei paragrafi pre- 
cedenti. 

La necessità di considerare spazi a infinite dimensioni si presenta nello stu- 
dio di numerosi problemi di matematica e di fisica. Sempre rimanendo nel cam- 
po dell’ottica, i problemi considerati precedentemente erano semplificati dal 
fatto che si è assunta costante la densità dei mezzi (aria o acqua), per cui la 
traiettoria della luce, essendo rettilinea in ciascun mezzo, è individuata dalla po- 
sizione dei punti dove la luce cambia direzione. Ma la situazione sarebbe stata 
diversa se fosse stata considerata la luce proveniente da una stella, in quanto essa 
incontrerebbe mezzi di densità variabile; infatti l'atmosfera della Terra è rare- 
fatta in alto e densa negli strati bassi. La luce viaggia più lentamente nell’aria 
di quanto faccia nel vuoto. La luce quindi, anziché decidere di arrivare in un 
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punto P in modo rettilineo, per impiegare il minimo tempo valuta quanto stare 
nella regione nella quale va più veloce; essa segue perciò una linea curva. 

Il principio di Fermat impone di considerare fra le curve che congiungono 
due punti quella per cui il tempo T impiegato a percorrerla è minimo. Il tempo 
T non è più un numero associato a un numero finito di parametri, ma un nu- 
mero associato a tutto il comportamento dei cammini possibili congiungenti due 
punti. Se si rappresenta con la funzione y(x) il cammino che la luce percorre 
per andare da un punto A a un punto B si è ricondotti a cercare quella fun- 
zione y(x) tale che A=(a, y(a)), B=(b, y(5)) e che minimizza l'integrale 


b 
9 fav 


dove n(x) rappresenta l’inverso della velocità della luce nel punto (x, y(x)). 

Alcuni problemi di questa natura furono già posti sin dalle origini del cal- 
colo delle variazioni alla fine del xvir secolo da Newton e da Bernoulli. Newton 
nel 1686 pose il problema del solido di rivoluzione di minor resistenza. È un 
problema che ha una notevole importanza pratica, interessando in modo essen- 
ziale la navigazione subacquea, l’aeronavigazione, la balistica. Quale è la forma 
più conveniente da darsi a un sommergibile, a un dirigibile, a un proiettile, a 
un missile, perché essi, muovendosi nell’acqua o nell’aria, incontrino la minor 
resistenza possibile e quindi, con una data forza motrice, raggiungano la massi- 
ma velocità? Il problema matematico si può formulare nel modo seguente: de- 
terminare la curva piana che unisce due punti dati A e B e che, ruotando attor- 
no a un asse, appartenente al suo piano e passante per A, genera una superficie 
di rivoluzione la quale, muovendosi, secondo il suo asse, in un mezzo omogeneo, 
incontri la minima resistenza. 

Per tradurre analiticamente il problema, si consideri nel piano determinato 
dall’asse di rotazione e dal punto B un sistema di assi cartesiani ortogonali aven- 
te l’asse x coincidente con l’asse di rotazione. Rappresentata allora mediante la 
funzione y(x), con le condizioni y(a)=0, y(5) =, la curva da determinarsi, 
la resistenza incontrata dalla superficie di rotazione è data dalla formula 


b 18 
(0) = R=R Î 22 de, 

a EI 
dove a e d indicano le ascisse dei punti A e B, A una costante, dipendente dalla 
velocità della superficie in moto. Nello scrivere l’espressione di RR si è supposto 
che la resistenza sia proporzionale alla proiezione della velocità del moto sulla 
normale alla superficie. 

Si consideri ancora un altro problema che interessa Ie applicazioni. Sia data 
una membrana elastica, cioè una superficie elastica piana in posizione di ripo- 
so, si flette liberamente e reagisce solo contro ogni tentativo di estenderla. In 
posizione di riposo la membrana occupi un dominio Q del piano x, y. Si defor- 
mi il contorno della membrana in una direzione perpendicolare al piano x, y e 
si indichi con g(x, y) lo spostamento del punto (x, y) del contorno. Allora anche 
l'interno della membrana viene deformato e ci si propone di determinare la po- 
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sizione di equilibrio della membrana per una data deformazione del suo con- 
torno. 

Assumendo che tutti i punti della membrana si spostino perpendicolarmen- 
te al piano x, y, si indichi con (x, y) lo spostamento del punto (x, y). La po- 
sizione di equilibrio della membrana è quella che fornisce il più piccolo valore 
possibile all'energia potenziale della deformazione fra tutte le deformazioni am- 
missibili. Le deformazioni ammissibili definiscono un insieme di funzioni tali 
che (x, y)=g(x,y) quando il punto (x, y) appartiene al contorno di 0. L’e- 
nergia potenziale di deformazione è data, in una buona approssimazione, dal 
cosiddetto integrale di Dirichlet 


Gc) f [e de dy 


dove , e u, sono le derivate parziali della funzione u(x, y) (cioè i coefficienti 
del suo differenziale). 

Un altro problema analogo al precedente è il seguente. Invece di deformare 
il contorno della membrana come precedentemente, si ponga un ostacolo sul 
piano x, y, ma al di sotto della membrana, tenendo fissi i punti del contorno 
della membrana e ci si domandi quale sarà la posizione di equilibrio della mem- 
brana in questa situazione. Il problema matematico è quello di ricercare il mi- 
nimo dell’integrale di Dirichlet fra tutte le funzioni «(x, y) nulle al bordo di Q 
e che descrivono le configurazioni ammissibili, cioè quelle che fanno stare la 
membrana al di sopra dell’ostacolo. 


5. Le equazioni differenziali del calcolo delle variazioni. 


Gli esempi considerati finora possono fornire un’idea del tipo di problemi 
che s'incontrano in calcolo delle variazioni. 

Sia V un insieme di oggetti di natura qualsiasi. La natura di questi oggetti 
può essere del tipo più vario. Gli oggetti possono essere numeri, punti dello 
spazio, curve, funzioni, superfici o anche moti di un sistema meccanico. Essi 
sono gli elementi dell’insieme V e saranno indicati con la lettera x. 

Ad ogni elemento x dell’insieme V corrisponde un numero reale y; sarà al- 
lora definita un’applicazione di V in R (l’insieme dei numeri reali). Queste ap- 
plicazioni sono chiamate anche funzionali. Se l'insieme V è l’insieme dei numeri 
reali x, il funzionale è una funzione di una variabile. Se V è l’insieme delle cop- 
pie ordinate di numeri reali, il funzionale è una funzione di due variabili e cosi 
via. Se V è un insieme di curve, un funzionale può essere definito associando a 
ciascuna di queste la sua lunghezza. Nel problema della luce e in quello di New- 
ton il funzionale consiste nell’associare a ogni curva che congiunge A con 8 il 
valore degli integrali (8) e (9). 

Il problema generale del calcolo delle variazioni è del tipo seguente: fra gli 
elementi x di V trovare quell’elemento (o quegli elementi) per il quale il valore 
del funzionale è il più piccolo possibile. 
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All’inizio di questo articolo è stata richiamata una condizione necessaria per 
gli elementi che rendono minimo un funzionale, nel caso della funzione di una 
o più variabili, la quale condizione esprime l’annullarsi del differenziale della 
funzione. 

È possibile trovare una condizione necessaria nei problemi più generali del 
calcolo delle variazioni che assicuri che un elemento di V fornisca un valore 
minimo al funzionale? Questo si può fare nel caso che gli elementi di V siano 
delle funzioni e il funzionale sia un integrale. Si consideri il caso dei cosiddetti 
integrali semplici del calcolo delle variazioni, cioè si supponga che il funzionale 
sia del tipo 


» 

(1) 10)= | Py) de 
a 

dove y(x) è una qualunque funzione dell’insieme V. La funzione F dipende 

dai tre argomenti x, y, y”. 

L'elemento generico di V è una funzione y(x) di x definita per a<x<b ivi 
derivabile, che assuma in a o in d valori assegnati. A parte queste condizioni 
la funzione y(x) può essere arbitraria. Di questo tipo sono il problema della 
luce e quello di Newton esposti nel $ 4. 

Si supponga che esista una funzione fra quelle ammissibili che rende mini- 
mo il funzionale /(y). 

Si consideri la famiglia di funzioni (dipendenti da un parametro «) $(x)= 
=)(x)+tan(x), dove n(x) è una funzione derivabile che si annulla in a e d. 
In tal modo tutte le funzioni della famiglia sono funzioni ammissibili. L’inte- 
grale calcolato su tale famiglia diventa\una funzione del parametro a 


17) 
I9)=9@)= f F(4,9-+000,y'+0m') de. 
a 


Siccome si è supposto che y(x) fornisca un minimo dell’integrale /(y), la 
funzione g(a) deve avere un minimo per x=o. Il suo differenziale in questo 
punto deve annullarsi. 

Un semplice calcolo fornisce, per ogni funzione y nulla in 4 e in ò, 


» 

o-g(0)= f [F,(%,9,9")N+Fyr (4,99 )N] da. 
a 

Questa condizione è l'analogo della condizione trovata per le funzioni di una 

o più variabili ed esprime che sull’elemento y(x) che fornisce il minimo dell’in- 

tegrale deve annullarsi la variazione 


b 
Î [Fy,(%,Y,9 )n+Fy(%,9,9)n] de. 
a 

Il procedimento precedente si estende anche al caso di un integrale multi- 
plo. Per semplicità si consideri il caso di un integrale doppio. Sia D un domi- 
nio del piano x, y. L'insieme delle funzioni ammissibili è definito dalle condi- 
zioni a) u(x, y) è differenziabile in D, b) i valori della v sul contorno di D siano 
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assegnati: u(x, y)=g(x, y); fra tutte queste funzioni cercare quella (o quelle) 
che rende minimo l’integrale 


I) = il [Feo 1 (3,9), (2,9), #(8,9)) ded. 


Come prima, si supporrà che esista una funzione ammissibile che renda mi- 
nimo l’integrale /(u). 

Si consideri la famiglia di funzioni, dipendenti da un parametro a, (x,y) = 
=u(x,y)+an(x, y), dove n(x, y) è una funzione differenziabile in D che si an- 
nulla sul suo contorno. Allora, come prima, la funzione 


I(2)= Î[ F(x,y,utan,uz+%Ma U,+%9y) dx dy= (a) 
D 


deve avere un minimo per x =0. Poiché, anche in questo caso, o è un punto 
interno dell’insieme di definizione della funzione 9(«), deve essere p'(0) =0; di 
qui segue con semplici calcoli 


(12) Sf {F.,m +FusMa+ Fu} dx dy=0. 
D 


Questa relazione esprime ancora che per una funzione «, la quale fornisca il 
minimo di I(u), la variazione deve annullarsi. 

Se la funzione (x, y) che minimizza l’integrale /(u) è derivabile due volte, 
un ragionamento classico dimostra che u deve soddisfare l'equazione differen- 
ziale alle derivate parziali (che viene chiamata equazione di Eulero) 


Ò Ò 
gl urag ia 

Per esempio il problema della posizione di equilibrio di una membrana, do- 
po aver deformato il contorno, corrisponde alla ricerca del minimo dell’inte- 
grale (10) con le condizioni al contorno u=g. 

L’equazione di Eulero ha la forma 

du du 

(13) Sata 


Fu 


Quindi il problema di determinare lo spostamento subito da una membrana do- 
po la deformazione del contorno si riduce a cercare una funzione armonica (cioè 
soluzione dell’equazione Au=0) che assuma i valori al contorno u=g. Se, in- 
vece di deformare il contorno, si considera la deformazione della membrana per 
effetto di un ostacolo posto al di sotto di essa, non si è più condotti all’equazione 
di Eulero in quanto la famiglia y+am non è formata da funzioni ammissibili 
per ogni a, e quindi non si può più dedurre che 9'(0)=0. 

Si denoti con Y(x, y) la superficie superiore dell’ostacolo. L'insieme delle 
funzioni ammissibili è quello delle funzioni che soddisfano le condizioni 4) 
u(x, y) è differenziabile in Q, 5) v(x, y) si annulla sul contorno di Q, c) (x, y)= 
>wy(x,y) in Q. Si osservi che se 2 e v sono due funzioni ammissibili, la fun- 
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zione 1v+(1-t)u=u+f(v—u) è ancora ammissibile se o<#<1. Ciò significa 
che l’insieme delle funzioni ammissibili è un convesso. 

Si supponga che la funzione u(x, y) fornisca il minimo dell’integrale (per 
esempio) di Dirichlet per tutte le funzioni ammissibili. Sia v un’altra funzione 
ammissibile; allora la funzione 


20)= [[ {+-+ +10-p td 
D 
ha un minimo per #=o0. Ciò implica che 


(4) fto 


per ogni v ammissibile. Questo risultato è analogo a quello del teorema di p. 970. 
Con una nomenclatura recente si può dire che la funzione « che rende minimo 
l'integrale soddisfa alla disequazione variazionale (14). 


6. Gli sviluppi del calcolo delle variazioni. 


I problemi considerati nel paragrafo precedente rientrano in un importante 
capitolo dell'analisi matematica: il calcolo delle variazioni. Lo sviluppo di que- 
sto capitolo della matematica è strettamente connesso con quello della matema- 
tica stessa. 

Fino alla fine del secolo scorso si ritenne ovvio che le soluzioni dei problemi 
in considerazione esistessero; risolvere il problema significava trovare le solu- 
zioni in termini di formule esplicite o di costruzioni geometriche. Ad esempio, 
nel caso della riflessione della luce la risoluzione è data da una semplice costru- 
zione geometrica e nel caso della rifrazione la risoluzione è data da una formula 
esplicita. 

Questa presunzione, circa il modo di intendere risolto il problema, risultò, 
nello sviluppo della matematica, piuttosto gratuita e spinse i matematici a dare 
un significato più ampio sul modo di intendere un problema risolto. 

L’evolvere del significato di risoluzione di un problema è una delle caratte- 
ristiche della matematica cui ha concorso anche lo sviluppo di vari strumenti 
di calcolo sempre più raffinati, quali i calcolatori elettronici. È infatti inutile 
avere, supposto che esista, una complicata formula matematica se poi nel calco- 
lo numerico di essa si è costretti a calcolare dei valori approssimati. A questo 
scopo è più interessante avere dei procedimenti che forniscono direttamente va- 
lori approssimati con un’approssimazione spinta quanto si vuole. 

Il problema tipico del calcolo delle variazioni è, come si è accennato in pre- 
cedenza, quello di trovare una funzione v: R?>0+R che minimizza o massi- 
mizza, in un insieme di funzioni ammissibili, l'integrale 


I(u)= (GONO dx 
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dove © è un sottoinsieme di R” e Vy indica l’insieme delle derivate di u(x) e 
f(x, u, p) è in generale continua con le derivate prime rispetto ai suoi argomenti. 

Per considerare un caso semplice si supponga che le funzioni ammissibili 
consistano in quelle funzioni assumenti valori assegnati nel contorno dQ di Q. 

La prima condizione necessaria che deve essere soddisfatta da una funzione 
estremante l’integrale Z(u) è che la variazione prima deve annullarsi su di essa. 
Di conseguenza la funzione estremante deve soddisfare l'equazione di Eulero 
con date condizioni al contorno. 

Un'altra condizione necessaria è quella dovuta a Legendre la quale richie- 
de che una funzione minimizzante deve soddisfare la condizione 


È. Snoj(% (2), Vu(a9a;zo. 


Essa esprime che la variazione seconda è non-negativa su una funzione minimiz- 
zante. Se nella condizione di Legendre il segno di uguaglianza vale solo quando 
X= (A, da; +--,,) è nullo, l'integrale /() è detto regolare e l'equazione di Eu- 
lero risulta essere di tipo ellittico. Si osservi che, ad esempio, per n=2, fissato x, 
u, la funzione f(«, u, p,, f,) come funzione delle componenti di Vu è una fun- 
zione che ha per linee di livello delle curve del tipo ellissi. 

Da questo punto di vista i problemi di calcolo delle variazioni si riducono 
allo studio delle proprietà delle soluzioni di equazioni differenziali. Ma la pro- 
blematica può essere invertita. La risoluzione di un problema al contorno per 
un'equazione differenziale può essere ricondotta a un problema di calcolo delle 
variazioni. Un tentativo fatto prim:. da Gauss nello studio dell'equilibrio di un 
campo elettrostatico e poi da Riemann in altre questioni di matematica pura fu 
messo in crisi da Weierstrass nel 1870. Sia Gauss sia Riemann avevano ammes- 
so come evidente che esistesse una funzione dotata di derivate e minimizzante 
l'integrale (10). Il lento superamento di queste critiche di Weierstrass fa parte 
della storia della matematica di questo secolo. 

La prima questione fondamentale che si presenta è quella di sapere se esiste 
una soluzione di un problema di calcolo delle variazioni 0, per formulare il pro- 
blema in termini più moderni, ci si deve chiedere se esiste qualcosa cui può es- 
sere attribuito il carattere di soluzione. 

Questo nuovo approccio alla teoria ha dato luogo ai cosiddetti metodi diretti 
del calcolo delle variazioni. Essi si sono sviluppati in stretta relazione con la teo- 
ria delle funzioni di variabili reali e con l’analisi funzionale. 

L’idea dei metodi diretti è quella di mostrare dapprima che l’integrale è li- 
mitato inferiormente, poi che esso è semicontinuo inferiormente rispetto a qual- 
che tipo di convergenza e infine che esiste una successione minimizzante di fun- 
zioni ammissibili che converge, nel senso richiesto, a qualche funzione ammis- 
sibile la quale non è detto a priori che ammetta derivate. Chiaramente tale fun- 
zione limite è una «soluzione » del problema considerato. 

È importante sottolineare che la convergenza della successione minimizzan- 
te non è data a priori ma la sua scelta dipende dal problema particolare. La scel- 
ta di una topologia conveniente e, di conseguenza, l'insieme appropriato di fun- 
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zioni ammissibili è il punto principale in molti problemi di analisi. Anzi, è que- 
sto punto di vista che, a giudizio di chi scrive, differenzia l’analisi da altri campi 
della matematica. 

Da queste considerazioni si è giunti ad individuare quale è il più opportuno 
insieme di funzioni da considerare come ammissibili. Lo studio di questi in- 
siemi ha condotto a considerare quelli che vengono chiamati spazi di Sobolev. 
Senza soffermarsi qui sulla descrizione delle funzioni di questi spazi, è possibi- 
le affermare che esse appaiono come le funzioni, le più generali, che dànno si- 
gnificato alla quantità (10). 

In molti casi è possibile allora dimostrare l’esistenza della soluzione, a con- 
dizione di dare a questa un significato molto generale. 

Si è visto prima che una funzione minimizzante di un integrale è soluzione 
dell'equazione di Eulero se si sa che questa possiede un certo numero di deri- 
vate. Questo non è il caso quando, per assicurare l’esistenza, si è costretti a ri- 
cercare la funzione minimizzante in spazi di Sobolev. 

In questi casi appare di primaria importanza sostituire l’equazione di Eulero 
con la forma che traduce l’annullarsi della variazione prima. I problemi al con- 
torno per equazioni differenziali, anche se non sono del tipo delle equazioni di 
Eulero di un integrale, vengono cosî formulati in una forma debole che è sug- 
gerita proprio dall’annullarsi della variazione. 

Ad esempio, il problema di determinare la soluzione dell’equazione Au =f 
che assuma i valori al contorno u=g è formulato nel senso seguente: trovare 
u tale che u =g su dQ e che soddisfi 


f (Up, +4,0y) dx dy -f fedex © per ogni g nulla su d0. 
o Q 


Si presenta allora un nuovo problema: una soluzione debole di un proble- 
ma al contorno ammette derivate di ordine superiore se i dati del problema fan- 
no altrettanto? Questo è il problema della regolarizzazione delle soluzioni de- 
boli. Problemi dello stesso tipo si presentano nella teoria delle disequazioni va- 
riazionali, teoria strettamente connessa al calcolo delle variazioni. 

In quest'ambito sorgono anche interessanti questioni sulla natura dell’in- 
sieme di contatto (cioè dell’insieme dei punti, ove, per rimanere all'esempio già 
illustrato alla fine del $ 4, ostacolo e membrana si toccano). 

In questa teoria possono infine formularsi alcuni problemi di frontiera li- 
bera. Si tratta di problemi dove il dominio nel quale si deve considerare il pro- 
blema non è noto a priori, ma deve essere determinato in modo da permettere 
alla soluzione di soddisfare dati sovrabbondanti sul contorno. 

Problemi di frontiera libera si presentano in numerosi problemi di matema- 
tica applicata. Mi limiterò a ricordare quello dello studio di un fluido in mezzi 
porosi, o quello della lubrificazione di un cuscinetto e infine quello della distri- 
buzione della velocità intorno a un profilo alare. 

Il tentativo qui fatto di esporre i principali campi dell’analisi che sono con- 
nessi all’idea di variazione mostra un aspetto della ricerca matematica moderna 
che è tuttora in pieno sviluppo. [G.s.]. 
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Il fisico sperimentale (cfr. fisica) indaga sulla natura alla ricerca dei fenomeni e delle 
leggi che li descrivono (cfr. empiria/esperienza, esperimento). Il matematico (cfr. 
matematiche) cerca le ragioni della scelta di una legge (cfr. convenzione, metodo, 
operatività, paradigma, scienza). In molti casi i fenomeni fisici sono descritti (cfr. 
spiegazione, teoria/modello) da applicazioni o da funzioni che rappresentano le 
configurazioni di un oggetto o l’evolvere di un fenomeno al variare del tempo (cfr. ci- 
clo, tempo/temporalità). L’indagine sulla natura particolare di una data legge spinge 
all’idea di variazione. Quest’idea presente fin dall’inizio del calcolo infinitesimale (cfr. 
anche differenziale) si sviluppa parallelamente al calcolo stesso. Molte considerazioni 
complementari (cfr. continuo/discreto, dipendenza/indipendenza, locale/globale, 
stabilità/instabilità) confluiscono nel calcolo delle variazioni: la simmetria all’origine 
delle prime considerazioni geometriche (cfr. geometria e topologia) è affiancata dalle 
idee più sofisticate della matematica moderna (cfr. strutture matematiche). Si viene 
cosi a costituire una vera e propria disciplina (cfr. disciplina/discipline) con problema- 
tiche peculiari. 


32 


